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自 2008 年 经 济 危机 爆发 以 来 ， 从 美联储 开始 ， 世 界 各 国 央 行 都 在 通 
过 货币 政策 防止 更 大 经 济 危 机 的 爆发 。 大 家 同时 也 认识 到 货币 与 经 济 政策 
只 能 缓解 经 济 危 机 的 严重 程度 ， 争 取 时 间 ， 而 不 能 从 根本 上 走出 经 济 危 机 。 
只 有 新 的 技术 革命 的 发 生 ， 世 界 才能 真正 地 走出 经 济 危机 。 

那么 下 一 场 技术 革命 是 什么 呢 ? 现在 有 很 多 推测 ,如 机 器 人 、 工 业 4.0、 
虚拟 现实 (VR)、3D 打印 、 人 工 智能 等 。 如 果 研 究 一 下 这 些 技术 的 影响 范围 ， 
就 会 发 现 它们 都 难以 担当 下 一 次 技术 革命 的 重任 。 

能 把 世界 拉 出 经 济 危 机 的 技术 革命 是 怎样 的 呢 ? 它 应 该 具有 以 下 特 
征 : 应 用 领域 非常 广泛 ， 而 不 局 限 在 某 个 行业 ，@ 影 响 的 人 群 非常 大 ， 
会 产生 大 量 新 兴 的 职业 ; @ 和 日 常生 活 息 息 相关 ， 具 有 很 大 的 渗透 性 。 

显然 ， 我 们 正 处 于 信息 技术 革命 的 末期 ， 越 来 越 多 的 迹象 表明 ， 信 息 
技术 革命 已 经 完成 了 它 的 历史 使 命 ，Q@ 英 特 尔 公司 已 经 走 上 了 赂 峰 ， 摩 尔 
定律 即将 失效 ， 难 以 开发 出 更 高 性 能 的 CPU， 即 使 推出 更 高 性 能 的 CPU， 
市 场 需求 也 不 大 ， 市 场 普遍 认为 现在 的 CPU 已 经 能 满足 现 有 需求 ，@ 智 能 
手机 经 过 高 速 发 展 后 ， 市 场 进入 饱和 期 ， 功 能 也 基本 满足 需求 ， 大 家 更 换 
手机 的 动力 减弱 ， 高 速 发 展 的 苹果 公司 销量 停止 了 增长 ; @@ 微 软 公司 推出 
的 Windows 10 操作 系统 免费 升级 ， 但 即使 使 用 多 种 强制 手段 ， 大 家 升级 
的 愿望 也 比较 弱 ， 甚 至 认为 即使 很 老 的 Windows XP 系统 也 能 满足 基本 需 
求 。 当 初 人 们 对 信息 技术 革命 的 期 望 ， 能 够 做 到 的 已 经 做 到 ， 不 能 做 到 的 
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现在 暂时 也 遥遥 无 期 。 

信息 技术 革命 给 我 们 留 下 什么 呢 ? 无 论 是 初期 的 大 型 计算 机 ， 还 是 后 
来 的 个 人 计算 机 、 笔 记 本 电脑 、 智 能 手机 ， 或 者 现在 很 时 新 的 物 联网 ， 都 
会 在 使 用 过 程 中 产生 大 量 的 数据 。 这 种 数据 分 散在 不 同 的 地 方 ， 很 多 数据 
用 完 即 扔 。 数 据 只 在 产生 的 过 程 中 发 生 了 作用 ， 历 史 数 据 价 值 并 没有 被 发 
据 。 特 别 是 物 联网 技术 产生 以 后 ， 收 集 到 越 来 越 多 的 数据 ， 但 很 多 数据 还 
没有 找到 用 处 。 

在 计算 机 出 现 的 初期 ， 人 们 就 对 利用 计算 机 实现 决策 支持 抱 有 非常 大 
的 期 待 。 关 于 决策 支持 系统 、 专 家 系统 的 研究 ， 有 一 段 时间 也 非常 红火 ， 
但 现在 看 来 这 个 期 望 还 没有 实现 。 以 实现 决策 支持 为 目的 的 商业 智能 领域 
虽然 积累 了 许多 有 价值 的 理论 和 技术 ， 但 达到 的 效果 还 不 能 满足 人 们 的 预 
期 目标 。 

综 上 所 述 ， 作 为 信息 技术 革命 成 果 输 出 的 大 量 数据 应 该 是 下 一 场 革命 
的 输入 ， 是 新 革命 的 原料 ， 信 息 技 术 革命 未 完成 的 使 命 就 是 下 一 次 革命 的 
目标 。 因 此 ， 下 一 场 革命 无 疑 应 该 是 数据 革命 。 

数据 革命 是 信息 技术 革命 的 延伸 ， 它 会 对 社会 产生 巨大 的 影响 ， 它 完 
全 是 从 另 一 个 角度 去 完成 信息 技术 革命 不 能 完成 的 目标 ， 还 会 对 信息 技术 
革命 的 产物 (比如 计算 机 网 络 、 云 计算 、 物 联网 ) 产生 更 大 的 需求 ， 导 致 
现在 看 来 过 剩 的 计算 能 力 又 变 得 不 足 。 

数据 革命 的 影响 巨大 ， 会 深入 到 社会 经 济 的 方方面面 。 现 在 凡是 用 到 
计算 机 的 地 方 ， 都 涉及 数据 的 问题 。 数 据 的 处 理 对 很 多 人 来 说 都 是 一 个 崭 
新 的 领域 ， 有 很 多 新 知识 需要 学 习 ， 并 因此 产生 许多 新 兴 职 业 。 

目前 已 经 出 现 一 些 与 数据 革命 相关 的 事情 ， 比 如 政府 开放 数据 。 现 在 
欧美 很 多 国家 政府 制定 了 政策 ， 要 求 政府 数据 、 有 政府 基金 资助 的 科研 数 
据 对 外 开发 ， 把 原来 保密 的 数据 变 成 共享 。 政 府 建立 起 开放 数据 网 站 ， 提 
供 可 机 读 的 数据 。 但 是 他 们 的 工作 局 限 在 数据 的 供应 上 ， 对 数据 如 何 利用 、 
如 何 产生 价值 还 依赖 社会 的 创新 ， 并 没有 找到 通用 的 方法 ， 也 没有 找到 通 
用 的 价值 创造 机 制 。 

数据 革命 中 的 数据 不 一 定 是 大 数据 ， 虽 然 对 海量 数据 的 认 知 离 不 开 大 


数据 技术 ， 但 大 数据 只 是 数据 的 一 个 特例 。 

本 书 的 目的 不 在 于 研究 数据 的 获取 ， 因 为 社会 上 已 有 足够 的 数据 ， 无 
数 运行 的 软件 日 夜 不 停 地 产生 着 新 数据 ， 无 数 程序 员 在 编写 着 程序 准备 产 
生 更 多 的 数据 。 本 书 更 多 地 是 放眼 于 数据 时 代 对 数据 的 存储 和 应 用 ， 以 及 
数据 应 用 会 产生 哪些 改变 ， 这 些 改变 包括 政治 的 、 经 济 的 、 社 会 的 等 ， 并 
且 探 讨 了 一 个 通用 的 数据 产生 价值 的 途径 一 一 决策 支持 ， 其 中 涉及 一 个 被 
称 为 “ 鹰 眼 ” 的 核心 技术 , 这 个 技术 的 推广 应 用 将 对 数据 使 用 发 挥 很 大 作用 。 

利用 数据 进行 革命 的 最 终结 果 应 该 是 : 人 们 通过 对 数据 的 分 析 ， 解 决 
了 在 经 济 生活 中 遇 到 的 一 些 难题 ， 反 过 来 推进 更 多 的 数据 的 产生 和 存储 ， 
再 进一步 推动 更 多 的 信息 技术 产品 的 生产 和 销售 ， 吸 引 更 多 的 人 从 事 与 数 
据 相 关 的 工作 。 
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开 编 故事 


2030 年 ， 中 国 经 济 经 过 深度 调整 ， 借 助 数据 革命 的 春风 ， 走 上 了 一 条 
健康 发 展 的 道路 。 虽 然 GDP 的 增长 率 已 经 大 大 下 降 ， 但 由 于 整个 社会 发 
展 比较 均衡 ， 增 长 后 劲 十 足 。 

中 国 不 但 拥有 完善 的 基础 设施 ， 而 且 基础 设施 的 收费 大 大 降低 ， 使 所 
有 生活 、 生 产 必需 品 在 整个 生活 、 生 产 成 本 中 的 占 比 大 大 降低 ， 原 来 家 里 
有 空调 不 敢 开 的 现象 已 基本 不 存在 了 ， 因 为 电力 成 本 在 收入 中 已 经 低 到 可 
以 忽略 不 计 ， 所 以 有 很 多 人 即使 不 在 家 也 整 天 开 着 空调 。 很 多 人 出 于 环保 
意识 经 常 在 网 上 呼吁 节约 能 源 ， 但 节约 能 源 完全 是 出 于 公益 心 而 不 是 基于 
成 本 的 考虑 。 高 速 公路 已 基本 上 实行 免费 ， 即 使 收费 也 非常 廉价 ， 更 多 的 
收费 是 用 于 不 同 的 时 段 调节 高 速 公路 上 的 车 流 ， 吕 免 高 峰 时 期 车 流 太 大 导 
致 车 速 降低 、 通 行 效率 下 降 。 现 在 ， 人 力 资本 已 成 为 所 有 企业 首要 考虑 的 
成 本 。 

由 于 传统 的 高 速 公 路 、 高 速 铁路 、 电 力 线路 等 基础 设施 建设 已 非常 完 
善 ， 所 以 在 2030 年 人 们 的 概念 中 ， 典 型 的 基础 设施 已 经 不 是 这 些 东西 
而 是 被 称 为 数据 基础 设施 的 数据 仓库 。 通 过 国家 建立 的 众多 的 数据 基础 设 
施 ， 无 论 人 们 在 工作 还 是 在 生活 中 都 能 获取 大 量 既 准确 又 及 时 、 详 细 的 数 
据 ， 从 而 大 大 提高 人 们 的 生活 和 工作 效率 ， 一 如 过 去 的 高 速 公路 提升 人 们 
的 出 行 效率 。 

张 开 是 西部 地 区 一 所 著名 高 校 的 毕业 生 ， 读 研究 生 的 时 候 ， 在 导师 指 
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导 下 开发 出 一 种 先进 的 医疗 器 械 ， 技 术 含 量 很 高 ， 市 场 前 景 广阔 。 他 在 家 
乡 成 立 了 一 家 公司 ， 并 且 具 备 了 一 定 的 生产 能 力 ， 准 备 到 上 海 去 开拓 东部 
市 场 。 

由 于 准备 在 上 海 住 一 段 时 间 ， 张 开 需 要 租 一 套房 子 。 张 开 从 上 大 学 开 
始 一 直 在 西部 地 区 ， 对 上 海 不 熟悉 ， 所 以 他 只 有 在 网 上 寻找 相关 的 信息 。 
他 首先 打开 上 海 官方 的 租房 数据 网 站 ， 先 研究 出 租房 源 和 价格 的 分 布 。 由 
于 他 决定 租 一 套 两 居室 的 房子 ， 所 以 从 分 析 不 同 区 域 房 源 数量 和 房屋 租金 
的 分 布 着 手 ， 看 到 不 同 租金 段 的 房子 在 地 图 上 用 不 同 颜色 标识 出 来 ， 颜 色 
密集 程度 表示 房 源 数 量 。 根 据 自 己 的 心理 价位 ， 张 开 觉 得 浦东 金桥 的 房 源 
比较 多 ， 房 租价 位 也 比较 合适 。 他 再 分 析 一 下 租金 历年 随时 间 的 变动 情况 ， 
发 现 现 在 是 一 年 中 租金 的 低谷 ， 而 下 个 月 由 于 很 多 毕业 生 要 求职 ， 每 年 这 
个 时 候 租金 都 会 上 升 ， 所 以 他 认为 这 个 月 应 该 赶快 租 好 房子 。 他 查询 了 几 
套 在 租房 网 上 的 详细 信息 ， 比 较 满意 ， 决 定 看 一 下 这 几 套 房子 ， 并 从 中 选 
择 一 套 。 

张 开 之 所 以 对 这 几 套 房子 的 信息 真实 性 没有 怀疑 ， 是 因为 这 个 平台 是 
政府 建立 的 ， 统 计数 据 完全 是 根据 房东 签约 后 缴纳 税收 的 数据 进行 统计 ， 
所 以 数据 的 准确 性 毋庸 置疑 。 出 租房 源 的 信息 虽然 是 由 房东 提供 通过 中 介 
发 布 的 ， 但 中 介 对 信息 的 真实 性 负 有 完全 的 责任 ， 因 为 根据 国家 数据 安全 
法 规定 ， 如 果 发 布 的 信息 不 真实 或 者 失去 时 效 ， 一 旦 租房 者 为 错误 或 失效 
数据 付出 成 本 ， 则 信息 发 布 者 需 按 租房 者 为 此 实际 付出 成 本 的 十 倍 进行 赔 
偿 。 也 就 是 说 ， 如 果 张 开 为 了 租房 从 西部 地 区 飞 到 上 海 而 没有 租 到 房 ， 那 
么 信息 发 布 者 要 按 来 回 机 票 的 十 倍 价格 进行 赔偿 ， 或 者 当天 由 于 信息 不 真 
实 没 有 租 到 房子 而 住 在 宾馆 ， 这 个 宾馆 房 费 的 十 倍 要 由 信息 发 布 者 来 承担 。 
如 果 张 开 选 择 入 住 一 家 五 星 级 宾馆 ， 即 使 耽误 一 天 赔偿 额 也 是 挺 高 的 。 所 
以 信息 发 布 者 是 非常 谨慎 的 ， 张 开 完 全 不 需要 担心 信息 的 真实 性 。 

张 开 在 预订 飞机 票 的 时 候 看 了 一 下 飞机 的 航班 时 间 ， 从 他 所 在 城市 到 
上 海 每 天 有 十 个 航班 ， 在 分 析 了 不 同 航 班 的 机 票 价格 和 误 点 率 等 信息 之 后 ， 
他 选择 了 一 个 很 早 的 航班 ， 因 为 他 想 早点 将 房子 定 下 来 就 可 以 不 用 住 宾馆 ， 
另外 也 由 于 早晨 的 航班 是 一 天 中 误 点 率 最 低 、 价 格 最 便宜 的 。 


张 开 搭乘 这 趟 早 班 航班 到 达 上 海 ， 他 在 上 海 很 顺利 地 找到 中 介 ， 在 几 
套房 子 中 选择 了 一 套 满意 的 租 了 下 来 。 

在 上 海 的 第 二 天 ， 张 开 就 开始 进行 市 场 的 拓展 工作 。 因 为 他 的 目标 客 
户 是 医院 ， 所 以 他 要 找到 上 海 所 有 医院 的 资料 。 在 2030 年 ， 由 于 数据 基 
础 设施 的 发 达 ， 以 前 的 人 脉 已 经 失去 作用 ， 如 果 像 以 前 要 依靠 人 脉 的 话 ， 
像 张 开 这 种 在 上 海 举 目 无 亲 的 人 是 无 法 在 上 海 开 拓 市 场 的 。 而 现在 的 政府 
数据 平台 上 ， 公 开 了 上 海 所 有 医院 的 信息 和 数据 。 张 开 先 分 析 了 一 下 所 有 
相同 功能 医药 器 材 的 采购 、 使 用 统计 和 增长 情况 ， 发 现 使 用 量 庞大 而 且 增 
长 迅速 ， 所 以 他 对 做 好 这 个 市 场 很 有 信心 。 然 后 他 又 在 这 些 数 据 中 ， 找 到 
使 用 量 排名 前 三 的 三 家 医院 ， 准 备 从 这 三 家 医院 着 手 。 由 于 他 的 生产 能 力 
有 限 ， 他 准备 先 打 开 市 场 ， 前 期 先 占据 10% 的 市 场 份额 ， 回 去 再 慢 慢 扩大 
生产 规模 。 在 数据 平台 上 ， 张 开除 了 看 到 使 用 量 以 外 ， 还 看 到 每 家 医院 采 
购 的 平均 价格 。 他 认为 他 的 产品 除 功能 有 创新 外 ， 价 格 还 是 有 竞争 力 的 。 
他 的 价格 比 现在 的 采购 价格 大 约 便 宜 10%。 

张 开 从 网 上 顺利 找到 这 三 家 医院 采购 部 门 的 联系 人 和 联系 电话 。 他 打 
电话 过 去 ， 和 第 一 家 医院 顺利 地 约 好 见面 时 间 。 第 二 天 按照 约定 的 时 间 ， 
他 拿 着 自己 的 样品 到 达 那 家 医院 ， 拜 访 了 这 家 医院 的 采购 负责 人 。 这 家 医 
院 的 采购 负责 人 是 一 名 非常 内 行 的 专家 ， 在 看 到 样品 之 后 ， 对 产品 的 功能 
和 质量 非常 认可 ， 当 即 决定 先 采购 小 批量 产品 在 医院 进行 试用 ， 满 意 后 再 
扩大 采购 规模 。 

首战 告捷 ， 张 开 非 常 高 兴 。 回 去 之 后 他 和 第 二 家 医院 也 约 好 时 间 ， 前 
去 拜访 。 这 家 医院 的 采购 负责 人 并 非 专业 人 员 ， 对 产品 的 质量 难以 把 关 ， 
当 他 看 了 样品 之 后 对 产品 质量 产生 怀疑 。 但 他 为 人 很 好 ， 建 议 张 开 到 政府 
的 检测 中 心 检测 一 下 产品 质量 ， 并 明确 表态 ， 若 是 质量 没有 问题 他 就 会 采 
购 小 批量 试用 。 于 是 张 开 根 据 他 的 推荐 ， 找 到 一 家 检测 机 构 ， 将 自己 的 产 
品 样品 送 过 去 检测 。 检 测 机 构 在 三 天 之 内 给 他 产品 的 检测 结果 。 张 开 将 检 
测 结果 拿 到 医院 之 后 ， 采 购 负责 人 也 同意 试用 。 张 开 承诺 交付 产品 的 质量 
和 检测 结果 是 一 样 的 ， 如 果 他 的 产品 和 检测 样品 有 差异 的 话 ， 根 据 质量 法 ， 
他 将 会 承担 巨额 的 罚款 ， 他 的 公司 也 可 能 由 于 这 项 罚款 而 倒闭 。 所 以 第 二 
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家 医院 看 到 他 能 够 生产 出 这 个 样品 ， 并 不 担心 批量 产品 质量 的 稳定 性 。 

第 三 家 医院 的 采购 负责 人 开始 拒绝 和 张 开 见面 ， 也 不 说 理由 。 张 开 把 
自己 产品 的 功能 优势 、 质 量 检 测 结果 ， 根 据 该 医院 使 用 量 统计 数据 计算 的 
成 本 节约 数据 告诉 这 名 负责 人 ， 并 表示 将 向 政府 公平 竞争 管理 部 门 投诉 ， 
该 负责 人 才 答 应 过 几 天 见面 。 张 开 后 来 才 知 道 该 负责 人 家 里 遇 到 事 ， 心 情 
不 好 。 

张 开 正 是 由 于 在 开拓 市 场 方面 所 费 功夫 甚 少 ， 所 以 他 把 精力 主要 放 在 

品 功能 的 完善 、 生 产 质 量 的 保证 和 产量 提升 上 ， 根 本 不 需要 在 销售 方面 
下 太 多 功夫 ， 而 且 他 也 知道 随 着 其 产品 的 供 货 扩大 ， 其 他 供应 商 也 会 在 产 
品 的 性 能 和 价格 上 和 他 竞争 ， 也 就 是 说 ， 他 现在 的 优势 只 能 维持 一 年 左右 ， 
所 以 他 还 必须 花 大 量 的 功夫 在 新 产品 的 研发 上 。 

张 开 的 东部 市 场 开拓 异常 顺利 ， 他 给 一 直 向 他 小 冷水 的 舅 鼻 打 电 话 报 
喜 。 舅 筋 对 他 这 么 快 就 能 打开 市 场 觉得 不 可 思议 : “数据 基础 设施 建设 效 
果真 的 这 么 神奇 ? ” 

张 开 对 未 来 充满 信心 ， 计 划 在 三 年 内 让 公司 上 市 ， 并 走向 国际 市 场 。 
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迎接 数据 革命 


信息 技术 与 经 济 社会 的 交汇 融 
合 引发 了 数据 迅猛 增长 ， 数 据 已 成 为 
国家 基础 性 战略 资源 ， 大 数据 正 日 益 
对 全 球 生产 、 流 通 、 分 配 、 消 费 活动 
以 及 经 济 运行 机 制 、 社 会 生活 方式 和 
国家 治理 能 力 产 生 重 要 影响 。 

务 院 《促进 大 数据 发 展 行动 
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1.1 信息 技术 革命 


数据 成 为 重 塑 国家 竞争 优势 的 新 机 遇 。 在 全 球 信息 化 快速 发 展 的 大 背 
景 下 ， 大 数据 已 成 为 国家 重要 的 基础 性 战略 资源 ， 正 引领 新 一 轮 科技 创新 。 
充分 利用 我 国 的 数据 规模 优势 ， 实 现 数据 规模 、 质 量 和 应 用 水 平 同步 提升 ， 
发 据 和 释放 数据 资源 的 潜在 价值 ， 有 利于 更 好 发 挥 数 据 资 源 的 战略 作用 ， 
增强 网 络 空间 数据 主权 保护 能 力 ， 维 护 国家 安全 ， 有 效 提升 国家 竞争 力 。 

国务 院 《促进 大 数据 发 展 行动 纲要 》 


1.1.1 未 完成 的 第 三 次 工业 革命 


18 世纪 中 叶 以 来 ， 人 类 历史 上 先后 发 生 了 三 次 工业 革命 。 目 前 ， 大 家 
一 致 认为 第 三 次 工业 革命 已 经 结束 ， 并 期 待 第 四 次 工业 革命 的 到 来 。 

有 人 把 第 四 次 工业 革命 ， 定 义 为 以 互联 网 产业 化 、 工 业 智 能 化 、 工 业 
一 体 化 为 代表 ， 以 人 工 智 能 、 清 洁 能 源 、 无 人 控制 技术 、 量 子 信息 技术 、 
虚拟 现实 为 主 的 全 新 技术 革命 。 显 然 ， 一 次 工业 革命 不 可 能 是 一 些 新 技术 
的 杂烩 ， 而 且 这 些 新 技术 还 依赖 数据 技术 的 发 展 ， 比 如 工业 智能 化 ， 在 数 
据 认 知 还 没有 完成 时 ， 智 能 决策 和 执行 无 从 谈 起 。 

从 第 一 次 工业 革命 的 蒸汽 机 和 第 二 次 工业 革命 的 电力 设备 来 看 ， 蒸 汽 
机 的 发 明 、 制 造 、 安 装 和 维护 虽然 是 一 个 巨大 的 产业 ， 但 产生 的 社会 影响 
远 不 如 其 带 来 的 规模 化 生产 (比如 钢铁 厂 和 纺织 厂 的 生产 以 及 铁路 的 铺设 ) 
来 得 深远 。 同样, 从 电力 的 发 明 来 看 , 电力 本 身 有 发 电机 以 及 发 电机 的 生产 、 
制造 和 服务 ， 但 它 的 影响 不 如 后 来 电力 输送 线 的 铺设 和 大 量 电器 的 使 用 以 
及 生产 中 动力 从 蒸汽 机 转变 为 电力 带 来 的 影响 大 。 


综 上 所 述 ， 每 一 次 工业 革命 都 由 两 个 或 多 个 部 分 组 成 : 第 一 个 部 分 是 
作为 引起 革命 标志 的 技术 的 发 展 ， 第 二 个 部 分 是 由 这 个 革命 的 技术 导致 的 
社会 更 深层 次 的 影响 。 

同样 ， 我 们 来 审视 一 下 第 三 次 工业 革命 。 第 三 次 工业 革命 是 以 计算 机 
的 发 明 使 用 为 基础 ， 计 算 机 本 身 己 经 产生 了 一 个 非常 大 的 产业 ， 对 人 类 社 
会 也 产生 了 巨大 影响 ， 但 这 不 是 第 三 次 工业 革命 的 最 终结 果 。 计 算 机 产生 
的 大 量 数据 以 及 由 于 我 们 对 数据 的 应 用 而 产生 的 变革 才 是 第 三 次 工业 革命 
更 大 的 成 果 。 

数据 革命 也 不 是 人 们 传说 中 的 第 四 次 工业 革命 ， 只 是 第 三 次 工业 革命 
的 下 半 场 。 第 三 次 工业 革命 分 为 两 部 分 ， 上 半 场 是 信息 技术 革命 ， 下 半 场 
是 数据 革命 。 原 因 有 两 个 : 一 是 这 两 场 革命 的 联系 如 此 密切 ， 难 以 分 开 ; 
二 是 数据 革命 实现 的 是 信息 技术 革命 未 完成 的 理想 。 


1.1.2 从 智力 符 代 到 辅助 决策 、 自 主 决策 


蒸汽 机 发 明 的 重要 意义 ， 在 于 人 类 首次 从 只 能 依靠 人 力 或 者 畜 力 作为 
动力 ， 变 为 可 以 以 机 器 作为 动力 ， 从 而 对 人 类 的 生产 经 营 活动 产生 了 巨大 
的 影响 。 原 来 只 能 小 规模 生产 的 产品 因为 机 器 的 发 明 能 够 进行 大 规模 的 生 
产 ， 火 车 头 或 者 轮船 可 以 通过 蒸汽 机 来 驱动 把 人 或 货物 运送 到 很 远 的 地 方 。 

计算 机 的 发 明 ， 同 样 拥有 一 个 相似 的 重要 意义 ， 人 类 首次 以 机 器 来 代 
替 人 类 的 智力 活动 。 蒸 汽机 以 机 器 代替 人 类 的 体力 活动 ， 计 算 机 以 机 器 代 
替 人 类 的 脑力 劳动 。 

但 是 ， 仔 细 分 析 从 计算 机 发 明 以 来 人 们 所 取得 的 成 就 ， 不 难 发 现 ， 计 
算 机 的 发 展 还 没有 完全 达到 预期 的 目标 。 

机 器 代替 人 类 智力 的 活动 有 三 个 阶段 。 

第 一 个 阶段 是 智力 替代 ， 即 原来 是 人 可 以 实现 的 智力 活动 ， 用 计算 机 
来 替代 。 比 如 ， 原 来 必须 用 心算 或 者 笔算 进行 的 计算 ， 用 计算 机 可 以 自动 
进行 ， 原 来 必须 依靠 个 别 智力 超群 、 经 验 丰富 的 人 才能 完成 的 工作 ， 可 由 
计算 机 来 完成 。 第 三 次 工业 革命 基本 上 完美 地 实现 了 这 个 阶段 的 目标 。 
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第 二 个 阶段 是 辅助 决策 ， 可 以 简单 理解 为 人 类 的 决策 活动 由 计算 机 来 
提供 辅助 。 虽 然 人 类 没有 计算 机 的 辅助 也 可 以 自主 决策 ， 但 由 于 精力 、 时 
间 等 诸 方 面 限制 ， 决 策 的 质量 通常 并 不 理想 。 比 如 ， 指 挥 员 在 不 知道 敌情 
的 情况 下 ， 也 可 以 发 起 一 场 战役 ， 但 常常 会 遭遇 惨败 。 决 胜 的 关键 在 于 能 
否 搜集 到 足够 的 情报 。 企 业 管理 中 能 否 做 出 正确 的 决策 ， 主 要 看 是 否 准确 
掌握 市 场 和 自身 的 综合 信息 。 就 是 说 ， 辅 助 决策 能 提升 人 类 智力 活动 的 水 
平 ， 就 这 点 来 说 ， 现 在 还 没有 达到 要 求 。 

第 三 个 阶段 是 自主 决策 ， 即 机 器 可 以 在 没有 人 工 干预 的 情况 下 通过 自 
主 学 习 进 行 决 策 。 现 在 以 深度 学 习 为 核心 的 人 工 智 能 已 经 能 做 到 自主 决策 ， 
但 毕 竞 这 个 发 展 才 刚刚 开始 ， 还 有 很 长 的 路 要 走 。 换 句 话说 ， 这 方面 已 经 
有 了 起 步 ， 但 还 远 远 没有 成 熟 。 

后 两 个 阶段 的 需求 并 不 是 现在 才 提出 来 。 在 计算 机 刚 发 明 的 时 候 ， 人 
们 已 经 提出 这 个 需求 ， 包 括 基 于 辅助 决策 的 DSS (决策 支持 系统 ) 的 研究 、 
AI (人工 智能 ) 的 研究 ， 在 几 十 年 前 都 已 经 开展 起 来 ， 并 且 取 得 一 些 成 就 ， 
后 来 由 于 技术 的 局 限 而 停滞 了 很 长 时 间 。 以 人 工 智能 为 例 ， 在 深度 学 习 的 
算法 得 到 突破 以 后 , 才 有 新 的 发 展 ,同样 , 辅助 决策 也 在 技术 上 陷入 了 停滞 ， 
只 有 引进 新 的 技术 、 新 的 思路 ， 才 会 得 到 发 展 。 

综 上 所 述 , 第 三 次 技术 革命 是 一 次 信息 技术 革命 ， 可 以 分 成 三 个 阶段 : 
智力 替代 、 辅 助 决策 、 自 主 决策 。 也 可 以 分 成 两 个 时 代 : 信息 技术 革命 时 
代 和 数据 革命 时 代 。 现 在 完成 了 信息 技术 的 革命 ， 只 完成 了 三 个 目标 中 的 
智力 替代 的 工作 ， 后 面 两 个 工作 需要 在 数据 革命 中 完善 。 


1.1.3 三 次 工业 革命 的 比较 


前 文 介绍 了 三 次 工业 革命 ， 接 下 来 对 三 次 工业 革命 的 过 程 进行 认真 的 
分 析 ， 以 此 为 借鉴 来 评估 第 三 次 工业 革命 以 及 未 来 的 发 展 。 

第 一 次 工业 革命 虽然 以 蒸汽 机 的 发 明 为 标志 ， 但 实际 上 它 真 正 对 社会 
产生 的 巨大 影响 在 于 后 来 汽船 的 发 明和 铁路 网 络 的 建设 ， 后 者 从 根本 上 改 
变 了 人 们 交通 的 手段 ， 使 人 和 货物 的 来 往 更 为 方便 廉价 。 比 如 : 汽船 的 发 


明 使 欧洲 到 美国 的 大 西洋 航行 更 为 快捷 ， 从 而 使 得 大 量 的 移民 可 以 抵达 美 
国 。 火 车 的 发 明 ， 特 别 是 美国 太平 洋 铁路 的 建设 使 美国 东西 海岸 得 以 相连 ， 
大 大 加 快 了 美国 西部 的 开发 。 

第 二 次 工业 革命 虽然 是 以 电力 的 发 明和 使 用 为 标志 ， 但 其 巨大 影响 和 
电灯 的 发 明 与 电力 网 络 的 建设 密 不 可 分 ， 就 是 说 只 有 在 电力 网 络 建设 比较 
完备 ， 电 力 能 被 很 多 地 方 的 人 所 使 用 的 时 候 ， 第 二 次 工业 革命 才 真 正 地 发 
挥 了 作用 。 

目前 ， 中 国有 三 个 非常 大 的 垄断 企业 ， 一 个 是 铁路 总 公司 ， 拥 有 中 国 
整个 的 铁路 网 络 ， 还 有 两 个 就 是 国家 电网 和 南方 电网 ， 垄 断 了 中 国 的 电力 
线路 。 它 们 分 别 是 两 次 工业 革命 的 成 果 ， 即 使 从 现在 的 角度 来 看 这 两 个 网 
络 也 是 一 个 国家 经 济 发 展 的 基础 ， 其 重要 性 有 目 共 睹 。 相 对 而 言 ， 火 车 机 
车 制造 企业 和 发 电 企业 的 重要 性 就 差 很 多 。 

第 三 次 工业 革命 发 展 到 现在 ， 虽 然 我 们 有 了 计算 机 和 互联 网 ， 但 它 
和 铁路 运输 及 电力 传输 的 差异 是 明显 的 。 现 在 在 互联 网 上 传输 的 都 是 用 
HTML 标准 标记 的 语言 制作 的 网 页 ， 相 对 于 我 们 拥有 的 数据 ， 可 以 在 网 络 
上 传输 并 且 识 别 的 数据 显然 数量 还 很 少 。 

对 比 铁路 和 电力 网 ， 铁 路 运输 的 是 人 和 货物 ， 它 只 负责 将 人 和 货物 从 
一 地 转移 到 另外 一 地 即 可 ， 这 是 一 个 通用 的 运输 工具 ， 不 管 货物 和 包装 是 
什么 都 能 送 达 。 同 样 ， 电 力 输 送 的 电 输送 到 任何 一 个 地 方 都 能 够 被 任何 以 
电力 为 能 源 的 设备 所 使 用 ， 也 是 一 种 标准 化 的 产品 。 

互联 网 和 铁路 、 电 力 网 有 比较 大 的 差距 ， 虽 然 互联 网 的 网 络 已 经 铺 就 ， 
但 传输 的 数据 没有 标准 化 。 传 输 的 数据 从 一 地 到 另外 一 地 ， 并 不 能 被 人 们 
方便 地 采用 ， 而 必须 通过 专业 的 协议 和 手段 才能 看 到 。 这 些 信息 的 格式 比 
较 多 ， 包 括 文字 、 图 片 、 音 频 和 视频 等 。 任 何 一 个 人 打开 一 个 数据 包 ， 并 
不 能 保证 他 能 读 懂 数 据 ， 这 是 因为 有 很 多 不 同 的 数据 格式 。 

因此 ， 三 次 工业 革命 结果 的 差异 就 在 于 : 第 一 、 第 二 次 工业 革命 是 先 
有 标准 化 的 产品 再 有 网 络 的 建设 ， 第 三 次 工业 革命 是 先 有 网 络 的 建设 后 再 
有 标准 化 的 产品 。 那 么 ， 要 完成 第 三 次 工业 革命 还 需要 什么 呢 ? 就 是 还 缺 
乏 一 次 数据 革命 ， 实 现 把 数据 当成 标准 的 产品 来 传输 。 
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大 家 知道 ， 在 一 个 新 产业 兴起 的 时 候 都 是 百花 齐 放 ， 有 很 多 的 标准 一 
起 出 现 , 有 一 些 混乱 。 但 当 一 个 产业 成 熟 以 后 , 技术 指标 总 是 归于 一 个 标准 。 
所 以 ， 目 前 在 网 络 传输 的 信息 混乱 正 是 信息 革命 初期 的 一 个 标志 。 在 数据 
革命 完成 后 ， 类 似 以 HTML 语言 为 标准 的 网 页 会 扩充 到 数据 上 ， 一 个 人 用 
浏览 器 就 可 以 阅读 不 同 的 数据 源 提 供 的 数据 。 


1.1.4 数据 是 信息 革命 的 主要 遗产 


自 第 一 台 计 算 机 发 明 以 来 ， 信 息 技 术 革 命 取 得 了 巨大 的 成 就 ， 使 人 类 
第 一 次 能 用 机 器 代替 人 脑 ， 就 像 第 一 次 工业 革命 ， 让 机 器 第 一 次 代替 人 力 
和 畜 力 一 样 。 

计算 机 可 代替 人 脑 或 者 一 些 辅助 手段 ， 比 如 计算 尺 、 算 盘 等 工具 来 计 
算 ， 实 现 了 用 机 器 代替 人 脑 计算 ， 从 而 使 复杂 和 大 规模 的 计算 成 为 可 能 。 
人 类 只 需要 把 计算 的 过 程 编制 成 程序 ， 无 须 每 次 重复 相同 过 程 ， 就 可 以 由 
计算 机 得 到 计算 结果 。 

在 我 们 所 处 的 时 代 ， 我 们 的 很 多 行为 都 深 深 地 打上 了 信息 时 代 的 烙印 。 
没有 计算 机 、 互 联网 和 电子 邮件 这 些 工具 ， 经 济 全 球 化 无 法 实现 。 很 多 新 
式 武器 及 航天 器 ， 无 不 建立 在 信息 技术 发 展 的 前 提 之 下 。 智 能 手机 的 普及 
不 但 使 人 手 一 台 计 算 机 得 以 实现 ， 而 且 使 信息 技术 的 受益 者 从 拥有 专业 技 
能 的 人 员 走 向 普通 大 众 。 

回顾 信息 技术 几 十 年 的 发 展 ， 计 算 机 本 身 发 生 了 哪些 变化 呢 ? 

计算 机 第 一 个 变化 是 从 无 到 有 ; 第 二 个 变化 是 从 大 到 小 ; 第 三 个 变化 
是 从 单机 走向 联网 。 

计算 机 从 占 几 间 屋子 的 大 型 计算 机 ， 到 放 在 一 个 房间 的 小 型 计算 机 ， 
再 到 桌面 上 的 PC， 又 到 人 手 一 部 的 智能 手机 ， 最 后 变 成 米粒 一 样 的 物 联 
网 的 智能 传感器 ， 其 体积 越 来 越 小 。 

计算 机 从 单机 走向 联网 的 发 展 : 从 原来 的 一 个 单位 一 台 计 算 机 到 一 个 
部 门 一 台 计算 机 ， 再 到 人 手 一 台 计 算 机 。 一 辆 汽车 上 有 几 十 台 计 算 机 ， 未 
来 随 着 智能 家 居 的 发 展 ， 一 个 人 家 里 将 有 好 几 十 台 计 算 机 。 


计算 机 的 联网 使 计算 机 中 的 信息 可 以 共享 ， 每 台 计算 机 都 不 是 一 个 独 
立 的 存在 。 自 己 的 数据 可 以 被 别人 读 取 ， 同 样 地 也 可 以 读 取 别人 的 数据 。 
如 果 没 有 互联 网 ， 计 算 机 的 价值 就 会 大 打折 扣 ， 因 为 有 些 计算 机 的 功能 就 
是 读 取 网 上 的 信息 ， 而 自己 根本 不 产生 任何 信息 。 

计算 机 的 发 展 还 使 原来 人 类 认为 完全 不 同类 型 的 信息 全 部 变 成 数据 。 
人 类 大 脑 可 以 认 知 的 信息 包括 视频 、 音 频 、 触 觉 、 嗅 觉 和 味觉 ， 视 频 信息 
和 声音 信息 都 实现 了 数字 化 。 原 来 用 各 种 各 样 模式 存储 或 者 传输 的 信息 全 
部 变 成 数据 。 因 此 ， 现 在 社会 上 产生 最 多 的 就 是 数据 ， 保 存 最 多 的 也 是 数 
据 ， 以 后 任何 一 个 人 的 生活 中 都 离 不 开 数据 ， 所 以 说 数据 是 信息 技术 革命 
留 下 来 的 最 大 资源 ， 以 后 还 会 不 断 地 增加 。 如 果 我 们 不 能 很 好 地 处 理 数据 ， 
不 但 不 能 为 人 类 服务 ， 可 能 还 会 产生 一 定 的 灾难 。 所 以 ， 数 据 革命 是 继 信 
息 技术 革命 之 后 的 又 一 次 机 遇 ， 更 是 一 次 挑战 。 


1.2 为 什么 是 数据 革命 


这 次 发 生 的 不 是 第 一 次 数据 革命 。 

在 数据 的 发 展 历程 中 有 过 两 次 数据 革命 。 第 一 次 数据 革命 是 近代 科学 
诞生 之 时 ， 实 现 了 数据 与 科学 研究 的 融合 ， 数 据 在 科学 研究 中 的 基础 地 位 
得 到 确立 。 对 研究 过 程 和 结果 赋予 精确 化 的 诉求 ， 是 近代 科学 的 基本 特征 
之 一 。 在 以 数据 为 依据 的 研究 范式 中 ， 数 据 的 可 靠 性 和 准确 性 代表 了 研究 
的 精确 性 ， 人 们 甚至 将 以 数据 为 依据 的 实证 研究 作为 判断 “科学 ”与 “ 伪 
科学 ”的 标准 。 叫 

第 一 次 数据 革命 解决 的 是 从 无 数 到 有 数 问 题 ; 第 二 次 数据 革命 解决 的 
是 从 小 数 到 大 数 的 问题 。 

为 什么 说 是 数据 革命 ， 而 不 是 数据 改革 或 者 是 数据 技术 呢 ? 

首先 ， 革 命 有 它 的 界定 条 件 ， 它 的 影响 面 要 足够 广 。 比 如 工业 4.0， 
它 只 局 限于 工业 , 对 医疗 、 教 育 并 无 大 的 影响 , 故而 不 能 称 之 为 革命 。 其 次 ， 
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革命 的 深度 以 及 对 时 间 的 要 求 : 革命 不 可 能 在 短 时 间 内 完成 ， 它 会 持续 
很 长 时 间 ， 甚 至 产生 的 影响 力 会 持续 儿 十 年 乃至 几 代 人 。 革 命 需要 众多 
人 参与 ， 并 非 一 个 公司 开发 出 一 个 产品 就 能 够 作为 一 场 革命 。 革 命 需要 
非常 多 的 社会 资源 ， 从 政府 到 个 人 都 要 积极 参与 才能 产生 效果 。 革 命 要 
对 经 济 产 生 巨 大 带动 作用 ， 能 够 引导 整个 社会 资源 的 配置 改革 方向 并 带 来 
投资 。 

除 此 之 外 ， 革 命 不 可 能 凭空 发 生 ， 它 需要 在 原 有 技术 的 发 展 基础 上 延 
续 下 来 。 同 时 ， 革 命 需 要 有 非常 明显 的 标志 ， 它 不 是 一 个 渐进 式 的 事物 ， 
而 是 一 个 有 独立 特征 和 广泛 影响 的 事物 。 

如 今 第 四 次 工业 革命 随 着 科学 技术 的 发 展 在 不 断 孕育 中 ， 工 业 4.0 是 
和 否 就 是 第 四 次 工业 革命 呢 ? 我 们 都 知道 信息 技术 革命 〈 第 三 次 工业 革命 ) 
的 主要 特征 是 计算 机 的 发 明和 应 用 ， 以 及 互联 网 的 发 明和 应 用 ， 其 产生 
的 影响 大 家 有 目 共 睹 。 但 是 ， 信 息 技术 革命 到 现在 已 经 逐渐 进入 尾声 ， 
特征 体现 在 计算 机 的 应 用 率 越 来 越 高 ， 特 别 是 智能 手机 的 发 展 和 普及 ， 
由 于 其 功能 和 计算 机 的 功能 越 来 越 接近 ， 现 在 已 经 达到 人 手 一 台 计 算 机 
的 水 平 。 

此 外 , 因 特 尔 公司 的 CPU 开发 使 计算 能 力 已 经 远 远 超过 了 现 有 的 需求 ， 
所 谓 的 摩尔 定律 物理 上 已 经 达到 极限 ， 智 能 手机 的 销量 也 已 经 从 顶峰 逐渐 
呈 下 降 趋势 ， 所 有 的 一 切 都 证 明 信 息 技术 革命 已 经 结束 。 

但 是 ， 我 们 有 些 问题 在 信息 技术 革命 中 并 没有 得 到 解决 。 在 计算 机 刚 
刚 发 明 的 信息 技术 革命 早期 ， 就 有 人 提出 了 DSS 的 概念 ， 可 是 到 现在 信息 
技术 革命 快要 结束 了 ， 人 们 并 没有 达到 在 信息 技术 革命 初期 的 预想 。 现 在 
的 技术 还 有 很 多 的 局 限 , 用 现在 的 技术 和 思路 并 不 能 解决 这 些 问 题 。 BI( 商 
业 智能 ) 技术 已 经 开发 并 推广 多 年 ， 却 迟 迟 不 能 得 到 普及 。 

信息 技术 革命 给 世界 带 来 巨大 进步 ， 也 留 下 很 多 问题 ， 主 要 集中 在 数 
据 的 共享 和 利用 上 ， 而 数据 革命 将 解决 其 中 的 大 部 分 问题 。 


1.3 ”社会 需要 数据 革命 


1.3.1 发 展 需要 资源 配置 均衡 


资源 配置 均衡 既是 社会 公平 正义 的 要 求 ， 更 是 经 济 快速 发 展 的 前 提 。 
资源 指 的 是 资金 、 土 地 、 原 料 、 能 源 、 教 育 、 医 疗 等 。 一 个 国家 无 论 贫穷 
还 是 富裕 ， 只 要 资源 在 不 同 地 区 、 不 同人 之 间 分 布 是 相近 的 ， 就 处 于 均衡 
状态 。 与 均衡 相反 的 是 贫 富 不 均 ， 甚 至 贫 富 悬殊 。 

经 济 的 发 展 都 有 商业 周期 ， 都 是 从 均衡 走向 不 均衡 。 不 均衡 的 产生 是 
由 于 在 经 济 发 展 中 ， 不 同行 业 有 不 同 的 发 展 规律 和 发 展 周期 ， 有 的 行业 遇 
到 技术 突破 或 市 场 机 遇 ， 会 得 到 迅速 发 展 ， 吸 收 大 量 社会 资源 ， 有 些 人 由 
于 天 赋 、 家 庭 、 教 育 、 个 人 经 历 、 从 事 行业 等 原因 富裕 起 来 ， 比 其 他 人 上 右 
据 更 多 资源 。 任 何 一 个 区 域 或 时 代 的 经 济 发 展 ， 都 会 经 历 从 不 足 到 过 剩 ， 
最 后 到 泡沫 的 过 程 ， 在 泡沫 阶段 不 合理 地 占用 过 多 资源 ， 需 要 调整 。 泡 淋 
的 破裂 使 这 些 资源 被 释放 出 ， 可 以 被 其 他 新 兴 行 业 吸 收 ， 走 向 新 的 均衡 。 
因为 无 法 预知 下 一 个 经 济 发 展 的 机 遇 在 哪里 ， 处 于 均衡 状态 的 资源 最 容易 
被 新 的 机 遇 所 吸引 ， 就 像 在 平原 上 的 水 可 以 向 任意 方向 流动 ， 而 位 于 山地 的 
水 流动 就 会 受到 群 山 的 阻碍 。 如 果 泡 沫 不 破裂 ， 处 于 这 个 行业 的 资源 就 无 所 
适 从 ， 不 离开 会 觉得 前 途 渺茫 ， 离 开 又 会 觉得 这 么 多 年 积累 丢弃 太 可 惜 。 

中 国 三 十 多 年 的 经 济 快速 增长 ， 创 造 了 人 类 社会 的 奇迹 。 对 其 中 的 原 
因 ， 有 不 少 专 家 做 了 研究 ， 甚 至 提出 了 “中 国 模式 ”。 改 革 开 放 初 期 的 资 
源 配置 相对 均衡 状态 ， 是 中 国 经 济 高 速 发 展 的 主要 原因 。 

中 国 在 改革 开放 之 初 ， 虽 然 经 济 落后 ， 但 由 于 新 中 国 成 立 后 的 土地 革 
命 、 公 私 合营 等 ， 使 原先 的 地 主 、 资 本 家 不 再 占有 过 多 资源 ， 整 个 社会 处 
于 均衡 状态 。 在 政策 开放 ， 全 国 集中 精力 发 展 经 济 后 ， 整 个 社会 发 展 动能 
十 足 ， 中 国 经 济 得 以 腾飞 。 

对 中 国 而 言 ， 政 策 至 关 重 要 ， 邓 小 平 功 不 可 没 ， 但 从 世界 范围 来 看 ， 
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仅 有 政策 是 不 够 的 。 很 多 国家 几 十 年 来 一 直 致力 于 发 展 经 济 ， 但 发 展 一 直 
很 缓慢 ， 原 因 就 在 于 国家 内 部 存在 严重 的 贫 富 悬 殊 ， 未 处 于 均衡 状态 。 在 
解释 拉美 和 北美 巨大 不 同时 ， 专 家 认为 在 北美 可 供 剥 削 的 土著 比较 少 ， 资 
源 配 置 比较 均衡 ， 而 南美 一 开始 就 建立 在 少数 人 剥削 广大 土著 之 上 ， 资 源 
配置 不 平等 问题 迄今 都 没有 解决 。 

中 等 收入 陷阱 产生 的 原因 是 在 经 济 得 到 一 定 发 展 后 ， 资 源 配置 均衡 被 打 
破 ， 既 得 利益 行业 、 企 业 和 个 人 占据 过 多 资源 ， 即 使 在 经 济 发 展 停滞 、 资 源 
过 剩 的 情况 下 ， 也 不 愿意 将 这 些 资源 释放 出 来 ， 政 治 和 经 济 体制 上 没有 建立 
像 美国 一 样 的 调整 机 制 ， 最 终 导致 经 济 失 去 活力 。 目 前 中 国 也 面临 同样 风险 。 

“二 战 ” 后 的 德国 、 日 本 经 济 的 快速 发 展 ， 也 是 得 益 于 被 战争 摧毁 后 
的 平衡 状态 。 特 别 在 日 本 被 盟 军 占领 期 间 ， 盟 军 司令 部 强制 解散 财阀， 并 
指令 日 本 政府 制定 法 律 防止 垄断 资本 复活 ， 使 日 本 社会 资源 配置 得 以 均衡 。 

美国 经 济 相对 欧洲 、 日 本 而 言 ， 具 有 很 大 弹性 ， 比 如 目前 美国 就 率先 
从 经 济 危 机 中 复苏 ， 这 与 美国 社会 的 再 平衡 能 力 有 关 : 美国 公司 遇 到 经 济 
低迷 就 裁员 、 破 产 ， 经 济 回 升 就 扩大 规模 。 

日 本 在 20 世纪 90 年 代 ， 虽 然 刺 破 了 房地产 泡沫 ， 但 维持 了 企业 泡沫 ， 
很 多 效益 不 好 的 企业 通过 银行 输血 活 了 下 来 ， 没 有 完成 再 平衡 ， 所 以 社会 
缺乏 活力 ， 新 企业 少 ,年 轻 人 就 业 困难 ， 导 致 现在 的 经 济 困 局 。 

在 市 场 经 济 下 ， 市 场 的 主体 基于 个 体 利益 的 考虑 ， 会 让 资源 配置 向 不 
均衡 方向 发 展 ， 比 如 房地产 热 的 时 候 ， 资 源 会 向 房地产 业 聚 集 ， 除 非 泡 沫 
破裂 。 政 府 的 作用 应 该 致力 于 均衡 ， 所 有 行为 应 该 有 利于 资源 在 全 社会 的 
均衡 配置 ， 而 不 能 助长 不 均衡 的 倾向 。 

数据 革命 的 目的 是 使 政府 和 全 社会 能 够 掌握 资源 分 配 的 状况 ， 防 止 资 
源 浪 费 ， 在 泡沫 产生 的 时 候 及 时 预警 ， 或 在 泡沫 破裂 的 时 候 及 时 调整 资源 
配置 ， 给 政府 的 调节 指明 方向 ， 对 调节 的 结果 及 时 予以 反馈 。 


1.3.2 数据 促进 社会 平等 


资源 配置 的 均衡 建立 在 平等 的 基础 上 ， 平 等 分 为 机 会 的 平等 和 结果 的 


平等 。 结 果 的 平等 是 一 种 不 公平 的 平等 ， 如 果实 现 了 ， 实 际 上 是 平均 主义 ， 
吃 大 锅 饭 。 机 会 的 平等 ， 是 资本 主义 推崇 的 一 种 平等 。 如 何 实现 机 会 的 平 
等 呢 ? 目前 被 认可 的 主要 做 法 是 保证 教育 的 平等 ， 就 是 保证 一 个 人 不 管 出 
生 背 景 如 何 ， 只 要 自己 有 天 赋 并 努力 ， 都 可 以 受到 良好 的 教育 。 实 际 上 ， 
即使 接受 同样 教育 的 同学 ， 家 庭 背 景 对 一 个 人 的 成 功 还 是 有 着 重大 影响 的 ， 
这 种 影响 的 原因 之 一 是 由 于 背景 的 差异 ， 每 个 人 获取 的 信息 不 对 称 ， 从 而 
机 会 也 不 对 称 。 

随 着 信息 技术 的 发 展 ， 越 来 越 多 的 信息 来 自 数据 ， 所 以 数据 的 平等 就 
是 信息 的 平等 。 数 据 的 平等 ， 应 该 是 机 会 平等 的 重要 组 成 部 分 ， 是 和 教育 
平等 同样 重要 的 平等 。 数 据 的 公平 ， 就 是 社会 上 每 个 人 都 可 以 公平 获取 个 
人 发 展 所 需要 的 数据 ， 比 如 专业 的 报考 人 数 、 毕 业 人 数 、 工 作 薪 酬 ， 招 聘 
的 企业 和 岗位 数 、 工 资 水 平 、 所 在 行业 和 区 域 等 ， 从 而 一 个 人 无 论 是 就 业 
还 是 创业 都 有 公平 的 起 点 。 


1.3.3 不 均衡 导致 中 国 古 代 王朝 更 返 


数据 是 衡量 社会 财富 是 否 均衡 的 有 力 工 具 。 

中 国有 五 千年 的 文明 史 。 从 秦始皇 开始 的 专制 历史 就 是 一 部 王朝 不 断 
更 迭 的 历史 。 很 多 学 者 都 研究 过 中 国 古 代 王朝 更 旭 的 原因 ， 一 般 认 为 是 由 
于 最 高 统治 者 采用 世 秦 制 ， 后 代 皇 带 养 尊 处 优 、 治 理 能 力 下 降 而 引起 的 。 

中 国 古代 每 个 新 王朝 基本 都 是 建立 在 战争 基础 上 。 累 年 的 战争 导致 生 
产 力 的 破坏 ， 原 来 占据 较 多 社会 资源 的 人 由 于 死亡 、 迁 徙 、 社 会 地 位 的 变 
化 等 原因 失去 原 有 的 优势 ， 社 会 资源 的 分 布 重新 变 得 较为 均衡 。 

但 随 着 时 间 的 推移 ， 新 的 强势 群体 逐步 掌握 了 越 来 越 多 的 社会 资源 ， 
积累 了 越 来 越 多 的 财富 ， 社 会 资源 开始 向 这 少 部 分 人 集中 ， 于 是 社会 开始 
逐渐 进入 新 的 不 均衡 状态 。 这 种 不 均衡 开始 并 不 太 严重 ， 人 们 还 可 以 接受 。 
但 经 过 几 百 年 ， 这 种 不 均衡 逐步 发 展 到 忍无可忍 、 民 不 聊 生 的 状况 。 这 时 
农民 起 义 就 会 爆发 ， 开 始 了 新 的 改朝换代 进程 ， 直 到 新 王朝 建立 ， 进 入 新 
的 均衡 状态 ， 再 开始 新 一 轮 的 循环 。 
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从 明 朝 的 封 藩 制度 ， 可 以 看 出 随 着 时 间 的 推移 ， 不 平衡 是 如 何 逐 步 发 
展 到 触目 惊 心 的 程度 的 。 

明 朝 分 封 诸 皇子 为 亲王 ， 并 规定 了 一 套 严格 的 封 藩 制度 。 到 了 嘉靖 初 
年 ， 明 朝 的 宗室 总 数 就 比 明 初 膨胀 了 上 千 倍 。 万 历年 间 ， 总 数 增长 到 三 十 
多 万 个 ， 明 末 天 启 年 间 ， 更 有 六 十 多 万 个 。 天 下 供应 京城 的 粮食 ， 每 年 
400 万 石 ， 但 各 王府 消耗 国家 的 粮食 ， 每 年 却 有 800 万 石 。 具 体 到 地 方 上 ， 
军事 重镇 山西 省 ， 每 年 存留 粮食 190 万 石 ， 但 当地 王府 消耗 粮食 ， 却 有 
300 多 万 石 。 河 南 省 存粮 94 万 石 ， 当 地 藩 王 消耗 粮食 ， 却 有 190 多 万 石 。 
也 就 是 说 ， 全 国 的 税 粮 加 起 来 ， 也 填 不 满 落 王 的 嘴 。 外 

一 个 社会 ， 如 果 拥 有 足够 准确 的 数据 ， 有 利于 及 时 发 现 社会 不 均衡 状 
态 ， 当 政 者 也 因此 可 以 及 时 调整 。 试 想 当 年 如 果 明 朝 历代 皇帝 可 以 对 宗室 
总 数 、 消 耗 粮食 数量 、 消 耗 粮食 与 全 国产 量 的 占 比 进行 分 析 和 预测 ， 就 可 
以 发 现 问题 的 严重 性 ， 及 时 进行 调整 。 实 际 上 ， 由 于 宗室 数量 增加 是 个 缓慢 
的 过 程 , 明 朝 皇帝 有 几 十 年 到 上 百年 、 几 位 皇帝 的 任期 时 间 去 做 调整 这 个 事 。 


1.3.4 业 增 原理 


在 物理 学 中 有 一 个 与 能 量 守恒 定律 具有 同等 地 位 的 基本 定律 一 - 烂 增 
原理 。 在 一 个 相对 封闭 的 体系 中 ， 表 达 混 乱 程度 的 衡量 指标 “ 米 ” 在 没有 
外 力作 用 下 是 一 直 增 加 的 ， 除 非 有 外 力 的 作用 “ 烂 ” 才 会 减少 。 就 是 说 ， 
一 个 封闭 的 系统 都 是 自发 从 一 个 相对 平衡 的 系统 转向 一 个 较为 混乱 的 系 
统 ， 这 种 变化 是 自发 行为 ， 无 须 人 为 干预 ， 而 只 有 需要 回 到 平衡 状态 时 才 
需要 外 力 干预 。 

将 此 原理 运用 到 经 济 上 ， 得 出 的 结论 是 经 济 发 展 的 自然 发 展 方向 是 从 
平衡 到 不 平衡 。 

如 果 一 个 社会 的 财富 分 配 比较 平均 ， 社 会 各 种 资源 的 分 配 比较 合理 ， 
那么 这 就 处 于 一 个 炉 值 较 小 的 状态 。 在 没有 任何 外 力作 用 ， 比 如 政府 调控 
或 天 灾 人 祸 等 因素 的 作用 下 ， 它 会 自然 地 向 炉 增 的 方向 发 展 ， 进 入 一 个 贫 
富 不 断 分 化 、 资 源 不 断 错 配 的 状态 。 这 个 状态 不 需要 人 为 干涉 ， 它 通过 市 





场 机 制 就 能 自然 发 展 。 

在 炉 值 增加 到 一 定 程度 时 ， 贫 富 晤 殊 、 资 源 错 配 会 严重 阻碍 经 济 的 发 
展 ， 经 济 发 展会 停滞 不 前 ， 直 到 经 济 危 机 爆发 、 战 争 爆发 或 改朝换代 。 

为 避免 经 济 发 展 的 停滞 ， 需 要 进行 有 利于 “ 炉 减 ”的 干预 ， 让 经 济 向 
平衡 状态 发 展 。 只 需 在 粹 增 过 程 过 于 剧烈 或 者 过 于 突出 的 地 方 进行 干预 ， 
从 而 实现 “ 炉 减 ”方向 的 调整 ， 无 须 随时 干预 。 顺 着 “ 炉 增 ”的 方向 干涉 
不 仅 无 效 ， 反 而 会 加 剧 它 的 不 平衡 。 

数据 革命 的 目标 ， 就 是 计算 出 经 济 的 炉 值 。 通 过 对 全 社会 经 济 数据 的 
分 析 和 研究 得 到 入 值 ， 然 后 从 全 局 或 者 某 个 行业 观察 炉 值 的 变化 ， 用 适当 
的 方式 进行 干预 ， 减 小 业 值 或 者 减缓 人 值 的 增长 速度 。 通 过 观察 干预 后 炉 
值 的 变化 ， 得 到 干预 措施 的 反馈 ， 知 道 干 预 的 效果 ， 对 干预 方法 进行 微调 。 
当然 ， 如 何 计算 衡量 经 济 的 粹 值 将 是 一 个 巨大 的 挑战 。 


1.3.5 中 国 国内 市 场 的 完善 


有 专家 对 历史 上 大 国 在 对 外 开拓 市 场 上 不 同 的 做 法 进行 了 分 析 ， 提 出 了 
一 个 适合 中 国 的 战略 : 以 优先 开发 国内 市 场 来 带动 “一 带 一 路 ”战略 的 成 功 。 

文章 的 核心 是 把 历史 上 大 国 开 拓 市 场 的 模式 分 为 四 类 : 第 一 类 是 抢占 
现存 大 国 的 市 场 开拓 模式 ， 如 德国 ， 这 是 一 种 危险 的 模式 ， 第 二 类 是 以 日 
本 为 例 的 依赖 霸权 国家 的 市 场 开 拓 模 式 ， 这 是 一 种 比较 脆弱 的 模式 ， 第 三 
类 是 英国 的 靠边 缘 国 家 的 市 场 开 拓 模 式 ， 这 是 一 种 比较 摇摆 的 模式 ， 第 四 
类 是 以 美国 为 例 的 基于 国内 开发 的 市 场 开 拓 模 式 ， 这 是 相对 比较 稳固 的 一 
种 模式 。 台 

从 中 国 的 经 济 来 看 ， 前 三 十 年 的 改革 开放 主要 靠 出 口 ， 所 以 虽然 劳动 
力 和 生产 工厂 都 在 国内 ， 但 实际 上 是 完全 按照 国际 市 场 的 规则 在 生产 、 贸 
易 。 现 在 由 于 劳动 力 成 本 上 升 ， 出 口 市 场 萎缩 ， 不 少 企业 把 市 场 转向 国内 。 
当 转 向 国内 市 场 后 ， 发 现 国内 市 场 贸易 规则 和 国际 市 场 完 全 不 一 样 ， 很 多 
方面 不 成 熟 ， 这 些 企 业 面 对 的 是 一 个 全 新 的 市 场 ， 需 要 遵守 全 新 的 规则 。 

美国 的 一 些 成 功 企 业 可 以 把 自己 的 商业 模式 在 世界 范围 内 复制 ， 但 到 
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了 中 国 就 不 行 。 通 常 把 这 种 失败 归咎 于 美国 企业 缺乏 灵活 性 ， 而 实际 上 是 
因为 遇 到 完全 不 同 的 市 场 规则 。 

中 国 国 内 市 场 规则 的 特殊 固然 可 以 保护 国内 企业 ， 但 同样 也 会 阻止 中 
国企 业 走 向 国际 市 场 。 

最 理想 的 方法 是 按照 国际 市 场 的 规则 去 重 塑 国内 市 场 。 然 而 ， 因 为 存 
在 着 很 多 的 制度 和 现状 的 瓶颈 ， 短 期 内 难以 实现 。 但 如 果 按 照 德国 模式 跟 
现存 大 国 抢占 市 场 的 话 ， 则 可 能 会 发 生 冲 突 。 

比较 切合 实际 的 思路 ， 是 按照 中 国 改革 开放 的 成 功 经 验 ， 存 量 不 变 做 
增 量 ， 不 急于 在 固化 的 现 有 体制 上 动 刀 ， 而 是 建立 新 的 体制 。 现 在 国内 市 
场 有 很 多 壁 又 ， 如 政府 管控 的 壁垒 、 运 输 成 本 的 壁垒 以 及 资金 流动 的 壁垒 
等 ， 这 些 壁 又 都 阻碍 了 国内 市 场 一 体 化 的 形成 。 但 是 基于 数据 的 信息 共享 
壁垒 还 没有 形成 ， 在 这 种 情况 下 ， 要 大 力 建立 数据 的 共享 机 制 。 

数据 共享 的 主要 特征 是 ， 建 立 公益 性 的 、 共 享 的 数据 交换 机 制 。 在 数 
据 壁 又 还 没有 形成 之 前 ， 必 须 抓紧 时 间 建 立 。 等 有 相关 的 利益 集团 形成 以 
后 ， 再 建立 就 很 困难 ， 改 革 会 遇 到 很 大 的 阻碍 。 

现在 ， 有 一 些 公 司 已 经 在 试图 建立 数据 共享 壁垒 了 。 例 如 ， 阿 里 健康 
在 医药 市 场 对 医疗 数据 建立 监控 码 的 平台 时 ， 就 在 试图 建立 这 样 一 个 壁垒 。 
这 个 平台 虽然 名 义 上 是 国家 食品 药品 监督 管理 局 拥有 ， 但 是 所 有 的 经 营 权 
都 归公 司 ， 政 府 在 技术 上 缺少 话语 权 ， 数 据 被 阿里 健康 垄断 ， 在 数据 共享 
上 以 安全 为 由 设置 障碍 。 此 案例 ， 表 明 政 府 对 数据 共享 缺乏 长 远 规划 ， 没 
有 数据 共享 平台 的 机 制 设计 。 





1.3.6 新 的 就 业 机 会 


数据 革命 能 够 带 来 新 的 就 业 机 会 。 

现在 的 经 济 危 机 需要 一 场 技术 革命 才能 带 来 复苏 。 这 种 技术 革命 的 最 
终结 果 可 带 来 大 量 的 就 业 机 会 。 这 种 就 业 机 会 主要 集中 在 几 个 方面 。 

(1) 推动 信息 技术 进一步 发 展 。 现 在 的 数据 虽然 可 以 采集 ， 但 人 们 
不 知道 怎么 用 ， 所 以 让 人 觉得 数据 有 多 余 。 数 据 的 采集 更 多 地 由 技术 驱动 ， 


比如 物 联网 。 物 联网 的 概念 兴起 以 后 大 家 都 在 搞 物 联网 ， 很 多 人 在 研发 物 
联网 设备 ， 推 广 物 联 网 的 应 用 ， 但 应 用 以 后 产生 大 量 数据 怎么 办 ， 结 果 发 
现 用 处 不 大 ， 或 有 些 很 小 的 用 处 。 到 了 数据 时 代 ， 等 发 现 了 数据 的 应 用 方 
法 后 ， 就 会 发 现 现在 的 数据 远 远 不 够 用 。 因 此 ， 对 信息 技术 、 信 息 设备 及 
其 相关 软件 的 开发 会 产生 大 量 的 需求 ， 现 在 的 信息 技术 的 应 用 和 设备 的 推 
广 出 现 新 的 、 更 大 的 发 展 空间 。 

(2) 有 许多 信息 需要 转换 成 数据 。 比 如 耶鲁 大 学 的 陈志武 教授 在 国 
内 合作 搞 的 量化 历史 ， 就 是 把 历史 记录 中 的 一 些 事件 量化 成 数据 。 因 此 ， 
信息 时 代 以 前 的 很 多 资料 都 可 以 做 量化 ， 目 前 很 多 信息 没有 数字 化 。 在 很 
多 研究 领域 ， 研 究 的 方式 会 产生 很 大 的 变化 ， 对 信息 技术 产生 很 多 新 的 需 
求 。 医 学 从 中 医 的 辩证 ， 到 西医 的 手术 ， 再 到 基因 组 的 数据 ， 基 因 组 技术 
本 质 上 可 以 说 是 数据 技术 ， 基 因 组 的 工作 实际 上 就 是 把 组 成 人 体 的 基本 信 
息 进 行 数 字 化 。 按 照 这 样 的 思路 ， 有 很 多 行业 都 会 出 现 这 方面 的 需求 。 

(3) 对 数据 的 转换 和 保存 。 现 在 数据 都 分 散在 不 同 的 地 方 ， 以 不 同 
的 格式 存储 ， 以 后 要 像 挖掘 文物 一 样 把 它们 挖掘 出 来 ， 让 它们 发 挥 作用 ， 
这 样 会 产生 大 量 的 数据 处 理工 作 。 

(4) 数据 分 析 。 对 数据 怎么 解读 ， 怎 么 预测 ， 需 要 大 量 掌 握 数 据 分 
析 技 术 的 人 员 。 

所 以 数据 革命 产生 许多 新 职业 ， 需 要 许多 新 的 从 业 人 员 。 





1.3.7 建立 社会 经 济 运 行 的 反馈 机 制 


反馈 是 物理 学 中 非常 重要 的 概念 ， 若 没有 反馈 很 多 的 物理 系统 根本 无 
法 正常 运行 。 

人 类 走路 也 离 不 开 反 馈 。 如 果 我 们 想 沿 着 一 条 直线 走 ， 并 且 把 眼睛 蒙 
上 的 话 ， 就 会 发 现 人 实际 在 转圈 子 。 我 们 在 走路 时 ， 实 际 上 需要 眼睛 不 断 
反馈 信息 ， 不 断 修正 步伐 ， 最 后 才能 走出 一 条 希望 的 直线 。 

人 类 的 工作 只 有 得 到 及 时 、 有 效 的 反馈 ， 才 能 做 得 更 快 更 好 。 奖 励 也 
是 反馈 的 一 种 。 拿 破 仑 说 : “只 要 有 足够 的 勋章 ， 我 可 以 征服 全 人 类 ”。 
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在 基础 设施 建设 等 领域 ， 可 以 很 方便 、 直 观 地 获得 反馈 信息 ， 比 如 建 
设 一 座高 楼 ， 每 多 建成 一 层 ， 目 视 即 可 了 解 进度 情况 ， 但 在 更 多 情况 下 ， 
只 有 通过 数据 才能 得 到 反馈 信息 。 

在 社会 科学 领域 ， 就 缺乏 很 好 的 反馈 机 制 。 比 如 ， 现 在 虽然 有 统计 局 
的 数据 对 宏观 经 济 进行 一 些 反馈 ， 但 实际 上 数据 不 太 准 确 ， 而 且 比 较 滞后 。 


1.3.8 权威 的 信息 交换 平台 


许多 新 兴 产 业 的 发 展 需要 一 个 权威 的 供需 信息 交换 平台 作为 支持 。 目 
前 ， 很 多 的 数据 发 布 在 不 同 的 平台 上 ， 缺 乏 权 威 性 ， 需 求 者 需要 去 不 同 的 
平台 查询 ， 对 数据 的 可 靠 性 也 有 怀疑 ， 这 一 切 影响 了 数据 经 济 的 发 展 。 我 
们 需要 一 个 统一 的 数据 操作 平台 ， 并 且 保证 数据 的 权威 性 ， 目 前 可 行 的 方 
法 就 是 这 个 平台 必须 是 公益 性 的 ， 必 须 是 由 政府 或 者 一 个 公益 组 织 提供 的 ， 
它 不 提供 具体 数据 的 变现 ， 只 提供 原始 数据 ， 并 且 保证 数据 的 合法 性 。 数 
据 的 合法 性 需要 法 制 的 保护 ， 比 如 在 数据 时 代 可 能 需要 对 数据 发 布 的 准确 
性 立法 ， 如 果 你 发 布 了 虚假 信息 或 者 信息 过 期 没有 及 时 清理 ， 需 要 承担 一 
定 的 法 律 责任 ， 或 者 对 这 些 信息 导致 的 后 果 要 承担 赔偿 责任 。 举 个 例子 来 
说 ， 有 一 个 人 发 布 了 一 条 虚假 信息 ， 哪 个 地 方 有 房子 闲置 出 租 ， 而 另 一 个 
人 知道 这 个 信息 后 打车 或 坐 飞 机 去 现场 看 房 ， 结 果 到 现场 一 看 这 个 房子 已 
经 出 租 。 这 种 情况 下 求 租 者 可 以 起 诉 信息 发 布 者 要 求 赔偿 他 的 交通 费用 和 
误工 费用 。 由 于 这 个 事情 涉及 的 总 额 比 较 小 ， 这 里 可 以 设 一 个 比较 高 的 惩 
罚金 ， 比 如 按 实际 发 生 费用 的 100 倍 赔偿 。 另 外 ， 对 使 用 数据 平台 的 商业 
公司 ， 在 业务 完成 以 后 ， 有 义务 随时 协助 发 布 者 清理 这 个 数据 。 如 果 没有 
更 新 、 清 理 数 据 ， 也 要 承担 相应 的 法 律 责 任 。 在 公共 数据 平台 上 ， 数 据 发 
布 者 对 数据 的 准确 性 负 有 法 律 责任 ， 但 是 ， 一 旦 有 商业 公司 接 过 这 个 数据 
提供 服务 以 后 ， 该 公司 有 义务 对 数据 的 状态 进行 及 时 的 更 新 ， 否 则 应 该 承 
担 相关 的 法 律 责任 。 


1.3.9 分 享 经 济 模式 的 扩张 


从 Uber 的 商业 模式 及 它 所 包含 的 意义 ， 可 以 看 到 发 达 西方 国家 虽然 
还 不 具备 数据 时 代 的 基础 设施 ， 但 有 公司 已 经 起 步 。 

Uber 是 美国 一 个 公司 推出 的 新 型 打车 业务 。 一 般 的 出 租车 有 专门 的 公 
司 、 专 门 的 车 辆 和 专门 的 司机 来 提供 出 租 服务 ， 有 政府 专门 的 定价 ， 它 是 
一 种 被 政府 法 规 规范 的 职业 。 但 是 Uber 提供 了 一 种 兼职 的 行为 ， 只 要 你 
有 车 ， 有 空余 的 时 间 ， 其 他 人 需要 打车 的 时 候 可 以 通过 Uber 公司 的 平台 
叫 到 你 。 

Uber 的 成 功 实际 上 一 个 是 信息 技术 的 成 功 ， 因 为 它 的 前 提 是 打车 的 人 
和 Uber 司机 都 拥有 智能 手机 ， 智 能 手机 提供 了 人 与 人 相连 的 网 络 功能 ， 
而 且 智 能 手机 还 有 一 个 重要 的 定位 功能 ， 这 样 就 能 够 非常 方便 地 让 Uber 
司机 了 解 顾客 准确 的 地 理 位 置 。 试 想 一 下 ， 如 果 没 有 智能 手机 的 普及 和 定 
位 功能 描述 ， 那 么 一 个 在 大 路 上 的 行人 必须 使 用 计算 机 ， 而 且 必 须 精 确 描 
述 地 理 位 置 ， 而 Uber 司机 必须 在 自己 车 上 配备 电脑 设备 并 能 上 网 才能 进 
行业 务 处 理 ， 这 样 的 话 ， 双 方 成 本 肯定 都 很 高 。 

现在 由 于 智能 手机 的 发 展 ， 对 计算 机 的 定位 、 上 网 功能 都 不 需要 额外 
的 花费 ， 利 用 现 有 的 功能 就 行 了 。 也 就 是 说 ， 一 个 Uber 司机 ， 他 根本 不 
需要 做 任何 的 投资 ， 加 入 Uber 网 络 就 可 以 了 。 当 然 Uber 的 成 功 还 依赖 他 
跟 美 国政 府 监管 部 门 的 不 断 斗 争 。 因 为 这 种 模式 违反 现 有 的 法 律 法 规 ， 它 
是 打 了 很 多 的 官司 以 后 才 得 以 成 功 运营 。 中 国 的 “ 滴 滴 出 行 ” 模 仿 了 Uber 
的 这 种 模式 。 

从 表面 来 看 ，Uber 通过 信息 技术 实现 了 对 闲置 资源 的 合理 配置 ， 把 原 
来 闲置 的 车 辆 和 闲置 的 人 的 时 间 利用 起 来 ， 为 社会 增加 了 出 租车 服务 ， 应 
该 说 是 一 种 促进 资源 优化 配置 的 先进 技术 ， 因 此 Uber 模式 得 到 非常 高 的 
评价 ， 被 认为 是 该 领域 的 一 场 革命 ， 甚 至 在 其 他 行业 遇 到 类 似 挑战 时 被 称 
为 “Uber 时 刻 ”。 

通过 深入 分 析 ， 发 现 Uber 模式 还 有 更 深层 的 意义 : 它 实 际 上 是 数据 
时 代 的 先驱 。 
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从 数据 角度 看 ，Uber 实际 上 是 收集 了 车 辆 和 打车 需求 数据 ， 然 后 进行 
了 匹配 ， 最 后 产生 了 业务 。 因 此 核心 是 一 种 数据 业务 ， 也 就 是 说 ， 你 只 要 
把 需求 数据 和 供应 数据 通过 计算 机 的 匹配 ， 就 可 以 产生 相关 的 收入 。 

Uber 的 数据 使 用 的 方法 实际 还 是 一 种 传统 的 数据 库 检 索 方法 ， 跟 真正 
数据 时 代 的 主流 技术 方法 还 是 不 一 样 的 。 所 以 Uber 只 是 一 个 数据 时 代 的 
开始 。 

Uber 模式 有 什么 局 限 呢 ? 虽然 Uber 实现 了 数据 服务 的 功能 ， 但 为 了 
实现 这 个 功能 ， 它 跨越 了 两 大 门槛 。 第 一 个 门槛 是 法 律 法 规 ， 它 跟 当前 社 
会 的 机 制 做 了 很 多 的 斗争 。 如 果 不 跟 政府 打 官 司 ， 它 根本 开展 不 了 现在 的 
业务 。 它 在 美国 各 地 的 业务 都 是 一 个 州 、 一 个 市 打 官司 争取 下 来 的 。 这 反 
映 了 现在 的 政治 体制 并 没有 为 通过 数据 配置 资源 提供 足够 的 支持 。 第 二 个 
门槛 是 Uber 利用 了 大 量 的 资金 ，Uber 成 功 的 非常 重要 的 一 点 就 是 以 不 断 
提高 估 值 来 融资 。Uber 的 商业 模式 并 不 是 它 发 明 的 ， 而 是 另外 一 家 公司 发 
明 的 ， 这 家 公司 由 于 没有 像 Uber 这 样 疯狂 的 融资 已 经 倒闭 。 也 就 是 说 ， 
需要 大 量 的 资金 支持 这 种 数据 的 应 用 。 

通过 Uber 案例 可 以 看 出 ， 人 类 要 进入 数据 时 代 非 常 困难 。 怎 样 降低 
数据 时 代 的 门槛 ， 政 府 应 该 做 哪些 工作 ， 让 类 似 Uber 的 模式 四 处 开花 呢 ? 

Uber 现在 开展 业务 的 数据 是 自己 花 巨 资 宣传 、 推 广 采 集 的 。 如 果 这 些 
数据 能 由 政府 资助 的 公益 平台 拥有 和 发 布 ， 任 何 公 司 免费 使 用 ， 那 么 类 似 
Uber 的 公司 就 可 以 低 门槛 进入 。 该 方案 把 Uber 的 模式 一 分 为 二 ， 一 部 分 
就 是 数据 的 采集 服务 作为 公用 事业 ; 另 一 部 分 对 这 些 数据 的 应 用 作为 一 个 
私营 企业 的 核心 竞争 力 。 

Uber 在 打车 领域 是 成 功 了 ， 但 按照 现在 的 模式 ， 在 许多 的 其 他 领域 很 
难 出 现 Uber 这 样 的 公司 。 因 为 作为 一 个 公司 它 要 专注 ， 不 可 能 轻易 进入 
其 他 领域 ， 第 二 它 要 找 最 容易 实现 的 商业 模式 ， 打 车 这 个 需求 促进 了 Uber 
的 成 功 。 如 此 推广 开 来 ， 在 其 他 需要 Uber 这 种 模式 的 领域 ， 不 大 容易 出 
现 Uber 这 样 的 公司 ， 要 在 其 他 领域 推广 很 难 。 但 如 果 把 Uber 的 模式 分 成 
两 部 分 ， 在 其 他 行业 相对 就 比较 容易 复制 了 。 

实际 上 在 美国 不 止 出 现 Uber 这 一 种 模式 , 还 有 两 个 公司 也 是 很 成 功 的 ， 


成 为 了 所 谓 的 “ 独 角 兽 ”公司 。 一 个 叫 AirBnB， 另 一 个 叫 WeWork， 他 们 
的 模式 实质 和 Uber 是 一 样 的 。 

AirBnB 让 人 们 把 家 里 空余 的 房子 在 它 的 系统 上 进行 登记 出 租 ， 然 后 要 
租房 就 可 以 住 到 人 家 家 里 去 。 这 个 房子 可 以 是 整 栋 房 也 可 以 是 一 个 房间 
就 是 把 现在 专业 的 宾馆 提供 的 住宿 服务 延伸 到 家 庭 ， 就 像 Uber 把 专业 出 
租 公司 延伸 到 普通 的 汽车 拥有 者 身上 一 样 。AirBnB 实质 上 把 房屋 资源 和 
时 间 资 源 拿 出 来 共享 。 

WeWork 的 模式 要 稍微 复杂 点 。 它 是 把 空余 的 办 公 室 、 办 公 楼 租 下 来 ， 
经 过 改造 ， 然 后 分 租 给 不 同 的 需求 者 。 原 来 租 办 公 楼 只 能 租 固定 面积 的 一 
大 间或 者 一 层 ， 但 如 果 人 员 在 迅速 扩展 中 ， 比 如 原来 是 10 个 人 ， 现 在 发 
展 到 100 个 人 , 就 需要 不 断 地 搬 办 公 楼 。 如 果 人 员 很 少 , 只 要 很 小 的 办 公 室 ， 
甚至 只 需要 一 张 桌 子 ， 可 能 就 没有 地 方 可 以 提供 。 而 WeWork 是 把 办 公 楼 
租 下 来 以 后 ， 分 割 成 小 房间 甚至 单个 办 公 桌 ， 让 你 根据 需求 去 租 ， 一 个 月 、 
一 年 都 可 以 ， 当 人 员 增 长 时 ， 只 要 扩大 租赁 就 可 以 了 ， 比 较 弹性 地 满足 了 
租赁 者 的 需求 。 空 余 的 办 公 楼 业主 都 希望 整 层 、 大 间 出 租 ， 出 租 不 掉 可 能 
就 空置 在 那里 ， 而 WeWrok 通过 改造 以 后 充分 利用 了 这 些 资源 ， 满 足 了 这 
些小 型 的 或 者 快速 发 展 的 公司 的 需要 。 

Uber、AirBnB 和 WeWork 的 核心 理念 是 相似 的 ， 主 要 通过 数据 服务 ， 
实现 资源 的 充分 利用 。 当 然 WeWork 要 复杂 点 ， 需 要 把 房子 租 下 了 并 且 进 
行 装 修 ，Uber 和 AirBnB 相对 简单 一 点 。 


1.4 ”从 海关 数据 看 数据 价值 


海关 数据 是 世界 各 国 海关 的 货物 进出 口交 易 数据 ， 主 要 来 自 关 单 、 提 
单 、 商 检 等 真实 的 单 证 记录 。 海 关 数 据 信息 是 国家 掌控 国际 贸易 变化 、 制 
定 贸 易 政 策 最 直接 的 依据 ， 同 时 也 是 企业 市 场 调研 、 国 际 市 场 开 发 的 重要 
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海关 数据 公开 是 合法 的 。 根 据 各 国 的 政府 法 令 、 贸 易 政策 的 不 同 ， 每 
个 国家 对 海关 数据 开放 的 程度 不 一 。 其 中 开放 程度 最 高 的 是 美国 ， 早 在 19 
世纪 70 年 代 美 国 就 通过 政府 立法 的 形式 公开 海关 数据 ， 后 来 授权 给 专业 
公司 进行 商业 化 的 运作 。 中 国 海关 也 有 相关 规定 ， 海 关 资 料 可 以 公开 。 

海关 数据 的 详细 程度 超过 大 家 的 想象 ， 一 个 公司 如 果 出 口 一 批 货 物 ， 
就 会 暴露 许多 商业 秘密 。 

以 下 是 一 个 关 单 的 数据 案例 : 


BUYER LASTICO DE INGENIERIA S.A. 





Date/ 日 期 2010-01 

Company/ 公司 名 称 PLASTICO DE INGENIERIA S.A. 

HS Code/ 海关 编码 39209200 
HS Description/ 编码 描述 OTHER PLATES, SHEETS AND 
和 次 STRIPSS OF POLYAMIDES 
2 Details/ 详细 描述 PLACAS DE POLIAMIDA|ROCHLING-F|50 X 620 
业 X 3000INO CELULAR SIN REFUERZO ESTRATIIFICACION NISOPORTE 
昌 SIN COMBINIAR CON OTRAS MATERIAS|2141 KN 
Customs/ 海关 VALPARAISO 

Transport/ 运输 方式 BY WATER 

Country_origin/ 原 产 国 GERMANY 

Country_shipped/ 启运 国 GERMANY 

CIF(US)/CIF 价 10386.2200 

Quantity/ 统计 数量 2141.0000 

Unit/ 计量 单位 KILOGRAMS 

Net Weight/ 净重 10780.0000 

Gross Weight/ 毛重 10780.0000 

Loading Port/ 装 货 港 AMBERES 

Unloading Port/ 卸货 港 VALPARAISO 


Freight(US)/ 运费 421.2000 
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Insurance(US)/ 保险 费 


以 下 是 一 个 提单 的 数据 案例 : 


195.3900 


BUYER: TRI-S INTERNATIONAL INC. 20 ROYAL 


Act arrival date/ 到 港 日 期 
Est_arrival date/ 预计 抵达 日 期 
Shipper/ 发 货 人 

Shipper ADDR1/ 发 货 人 地 址 1 
Shipper ADDR2/ 发 货 人 地 址 2 
Shipper ADDR3/ 发 货 人 地 址 3 
Shipper ADDR4/ 发 货 人 地 址 4 
Consignee/ 收 货 人 

Consignee ADDR1/ 收 货 人 地 址 1 
Consignee ADDR2/ 收 货 人 地 址 2 
Consignee ADDR3/ 收 货 人 地 址 3 
Consignee ADDR4/ 收 货 人 地 址 4 
Notify/ 通知 方 

Notify ADDR1/ 通知 方 地 址 1 
Notify_ ADDR2/ 通知 方 地 址 2 
Notify_ ADDR3/ 通知 方 地 址 3 
Notify ADDR4/ 通知 方 地 址 4 
Container Number/ 集装箱 号 
Piece Count/ 件数 

Description/ 货物 描述 


2010-01 

2010-01-05 

TECNO ART MARMI SRL 
VIA NETTUNESE KM 13 
ARICCIA 


第 
SHAW INDUSTRIES GROUP INC 2 
章 
616 E WALNUT AVE l 
迎 
DALION GA 30722-2300 妆 
据 
单 
命 
TRANS TRADE USA INC 
1040 TRADE AVENUE 


IRVING TX 75063 


UACU3171616 
49 
TRAVERTINE TILES SLAC 49 PCS 


EXPRESS RELEASE EMAIL DO W TRUCKER INFO TO UAAIDELVRYORDER@ 


UASC.NET ALSO SEE GOAL108439 
Carrier Code/ 承运 人 代码 


UASU 


Vessel Country Code/ 船 东 国家 代码 AE 


Vessel Name/ 船 名 
Voyage Number/ 航次 
Bill Of Lading nbr/ 提单 号 


Foreign Port Lading/ 启运 港 代 码 


Place Receipt/ 发 货 地 
Port Name/ 纯 货 港 
Manifest Qty/ 载 货 数 量 
Manifest Units/ 载 货 单位 
Weight/ 重量 

Weight Unit/ 重量 单位 
Measurement/ 尺寸 


Measurement Unit/ 尺寸 单位 


Remarks/ 备注 





. 评 斗 当归 全 祠 涝 清 省 
十 则 广 湾 - 
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宣 | 


AL ABDALI 

0033W 
UASUGOAL108440 

47531 

LA SPEZIA7d!Q-\8{ “}(14^ 
SAVANNAH, GA. 


lll 
KGt1J4T5G4J%k8P9ON 
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PO. 790133 | NO MARKS | NO 


MARKS | NO MARKS | NO MARKS | NO MARKS 


同行 看 到 这 些 数据 ， 可 以 得 到 很 多 有 用 的 信息 : 从 发 货 单位 可 以 知道 
有 哪些 行业 竞争 对 手 、 行 业 潜 在 客户 或 供应 商 。 从 装 货 港 可 以 预测 货物 产 
地 、 竞 争 对 手 的 分 布 。 从 数量 可 以 分 析 同 行 的 生产 规模 、 供 货 能 力 、 供 货 
总 量 、 市 场 份额 。 从 卸货 港 可 以 预测 最 终 消费 地 区 、 采 购 商 分 布 。 从 收 货 
单位 可 以 了 解 老 客户 忠诚 度 、 发 现 潜在 客户 、 找 机 会 夺回 已 失去 客户 。 

从 信息 安全 性 角度 看 ， 如 果 想 跟 任 何 一 个 出 口 企业 索取 这 些 数据 的 话 ， 
他 一 定 会 以 商业 秘密 为 借口 拒绝 提供 。 

事实 上 ， 这 些 互相 竞争 的 出 口 企业 并 没有 由 于 商业 秘密 的 泄露 而 破产 ， 
国际 贸易 也 没有 由 于 海关 数据 的 公开 而 月 泪 。 不 但 不 受 影响 ， 反 而 促进 了 


国际 贸易 。 


所 以 说 ， 隐 私 不 能 成 为 阻碍 数据 开放 的 借口 。 


1.5 ”美国 的 启示 


中 国 现 阶段 的 主要 目标 是 跨越 中 等 收入 陷阱 ， 进 入 发 达 国 家 行列 。 考 
察 作为 世界 最 大 的 发 达 国家 一 美国 ， 对 中 国 未 来 的 发 展 具有 重要 意义 。 
虽然 考察 过 美国 的 人 很 多 ， 但 仁者 见 仁 ， 智 者 见 智 ， 不 同人 对 同 个 事物 和 
现象 有 不 同 着 眼 点 和 看 法 。 

笔者 分 两 次 在 美国 的 东 、 西 海岸 做 了 自驾 游 ， 游 览 的 同时 对 美国 的 经 
济 社会 进行 了 一 些 观察 和 思考 ， 并 且 平 时 也 比较 关注 对 美国 的 一 些 报道 。 
儿子 在 美国 留学 期 间 也 反馈 了 一 些 信息 。 

两 次 自驾 游 每 次 都 是 半 个 月 时 间 。 第 一 次 是 在 西海 岸 ， 包 括 加州 全 境 ， 
从 北边 的 旧金山 一 直到 南边 的 圣地 亚 哥 ， 往 东 到 凤凰 城 ， 北 边 到 大 峡谷 和 
拉 斯 维 加 斯 。 第 二 次 主要 是 东北 部 ， 水 牛 城 到 波士顿 、 纽 约 、 费 城 、 华 盛 
顿 这 条 线 。 因 为 是 自驾 游 ， 所 以 比较 自由 ， 住 宿 、 租 车 、 吃 饭 基 本 都 是 自 
己 安 排 。 在 东部 拜访 了 两 个 同学 ， 到 他 们 家 里 做 客 。 通 过 考察 和 思考 ， 我 
觉得 美国 有 很 多 东西 值得 我 们 学 习 。 

在 美国 主要 有 几 个 感受 : 第 一 ， 工 资 高 ， 人 工 成 本 高 ， 人 员 的 成 本 费 
用 高 ， 从 人 员工 资 高 可 以 解释 很 多 的 现象 ， 第 二 ， 资 源 配置 比较 均衡 ， 区 
域 之 间 差 异 比较 小 ; 第 三 ， 相 对 收入 来 说 美国 的 物价 非常 低 。 

很 多 人 认为 发 达 国 家 应 该 收入 高 ， 同 时 物价 也 高 。 实 际 上 ， 美 国 相对 
于 它 的 人 均 收 入 来 说 ， 其 物价 是 非常 低 的 。 举 个 例子 ， 不 考虑 币 种 和 汇率 ， 
美国 人 可 能 一 个 月 有 5 000 元 的 收入 ， 中 国人 也 有 5 000 元 的 收入 ， 但 在 
美国 ， 苹 果 手 机 只是 600 多 美元 ， 而 在 中 国 ， 苹 果 手 机 却 要 5 000 多 元 人 
民 币 ， 从 这 个 比例 来 看 ， 中 国 的 物价 和 收入 比 将 近 美 国 的 8 倍 。 

那么 ， 在 美国 的 人 力 成 本 这 么 高 ， 为 什么 美国 的 物价 会 这 么 低 ， 它 是 
如 何 做 到 的 ? 

首先 要 搞 清 发 达 国 家 的 真实 含义 。 所 谓 的 发 达 就 是 人 均 收入 高 ， 购 买 
力 强 ， 生 活水 平 高 才 叫 发 达 。 如 果 一 个 社会 人 均 收入 高 ， 物 价 也 高 ， 显 然 
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这 不 叫 发 达 ， 而 叫 通货 膨胀 。 只 有 保持 物价 低 ， 才 能 体现 出 发 达 。 

据 作者 观察 分 析 ， 美 国 物价 低 的 原因 有 两 个 ; 第 一 是 公共 成 本 低 ; 第 
二 是 效率 高 。 这 里 的 公共 成 本 是 指 所 有 企业 和 民众 都 会 承担 的 成 本 ， 比 如 
土地 、 电 力 、 高 速 公路 、 汽 油 。 效 率 高 的 主要 特点 是 : 

(1) 自动 化 程度 高 ; 

(2) 自助 项 目 较 多 ; 

(3) 关注 流程 设计 。 

这 些 实际 上 都 是 由 于 人 力 成 本 高 导致 的 。 在 麦当劳 刚 到 中 国 时 ， 它 的 
标准 化 产品 和 销售 流程 给 中 国人 很 多 的 震撼 ， 但 这 种 设计 在 美国 实际 上 已 
经 是 一 种 标准 化 的 设计 。 在 中 国 由 于 人 力 资源 比较 丰富 ， 这 种 对 流程 的 设 
计 不 太 讲究 ， 所 以 才 觉 得 新 奇 。 

在 加 州 从 1 号 公路 去 丹麦 村 索 尔 文 的 路 上 ， 看 到 一 个 典型 的 加 油 站 ， 
加 油 站 大 概 有 8 个 加 油 柱 ， 里 面 还 有 个 较 大 的 超市 ， 而 整个 这 样 大 的 加 油 
站 只 用 了 一 个 人 。 一 个 人 怎么 胜任 工作 的 呢 ? 外 面 的 加 油 都 是 自助 的 ， 用 
信用 卡 可 以 在 加 油 柱 上 直接 刷卡 ， 也 可 以 到 超市 里 面 刷 卡 或 付 现金 。 付 款 
都 由 这 个 人 负责 。 告 诉 他 你 的 汽车 停 在 几 号 加 油 柱 ， 付 完 款 后 就 会 开通 几 
号 加 油 柱 加 油 。 超 市 有 个 很 大 的 窗户 ， 他 在 里 面 完全 可 以 看 到 外 面 加 油 站 
的 加 油 情况 。 超 市 里 有 很 多 东西 是 自助 的 ， 比 如 说 咖啡 你 可 以 付 了 钱 以 
后 ， 自 助 选择 自己 需要 的 咖啡 种 类 。 他 一 边 观察 店 里 的 情况 ， 一 边 收 款 ， 
而 一 些小 东西 布置 得 很 方便 ， 比 如 要 买 香烟 ， 他 在 头 上 柜子 一 伸手 就 可 以 
拿 到 。 

另外 ， 在 美国 租 住 旅馆 ， 在 退 房 时 是 不 会 查 房 的 。 这 种 现象 被 国内 很 
多 人 解释 为 美国 人 的 信用 度 比 较 高 。 我 的 理解 是 主要 查 房 的 成 本 太 高 ， 即 
使 于 了 东西 ， 在 美国 物价 很 便宜 ， 其 损失 远 远 低 于 雇 一 个 人 要 支付 的 成 本 。 
一 家 旅馆 里 ， 一 个 负责 登记 的 服务 员 同 时 也 兼 管 早餐 服务 。 

在 美国 各 地 ， 购 物 中 心 都 集中 在 一 个 叫 Plaza 的 广场 上 。 这 个 广场 的 
店面 配置 非常 科学 ， 每 个 店 都 非常 个 性 化 ， 相 互 之 间 错 位 竞争 。 这 些 店 都 比 
较 大 ， 比 如 有 综合 性 的 百货 商店 如 梅 西 百货 ， 有 专卖 办 公用 品 的 Staples( 史 泰 
博 )， 有 专卖 婴 幼儿 用 品 等 ， 还 有 不 同 风格 的 快餐 店 。 这 些 店 用 人 很 少 ， 基 


本 都 是 连锁 店 。 美 国 只 有 在 唐人 街 和 墨西哥 人 居住 的 地 方 有 小 店 。 

比如 在 洛杉矶 ， 如 果 所 有 的 商场 必须 建 在 市 中 心 ， 那 它 的 地 价 肯定 会 
很 高 ， 如 果 可 以 选 在 任意 的 地 方 建 商场 ， 成 本 就 会 很 低 。 毕 竟 如 果 可 以 任 
意 选 一 个 地 方 围 一 个 四 方形 ， 主 要 中 间 建 个 停车 场 ， 周 边 就 可 以 开店 ， 地 
主 就 不 能 随便 要 价 。 

在 美国 ， 一 般 吃 一 顿 西餐 快餐 在 8 美元 左右 ， 鸡 蛋 最 便宜 的 1 美元 能 
买 12 个 ， 当 然 这 跟 美 元 相对 币值 比较 高 有 关 ， 跟 其 他 的 货币 相 比 它 换 回 
的 石油 价格 比较 低 ， 但 最 关键 的 还 是 它 的 整个 商品 经 营 的 成 本 比较 低 。 

由 于 美国 汽车 普及 率 高 ， 所 以 它 的 商店 可 以 设 在 任意 的 地 方 ， 这 样 就 
可 以 避免 类 似 中 国 高 地 价 的 困扰 。 当 然 在 美国 东部 像 纽 约 这 样 的 城市 ， 它 
的 地 价 还 是 很 高 的 。 另 外 它 的 油价 很 便宜 ， 高 速 公路 很 多 都 是 免费 的 ， 西 
部 基本 是 免费 的 ， 东 部 只 有 部 分 收费 。 美 国 只 要 是 基础 需求 ， 就 便宜 甚至 
免费 ， 因 为 越 是 基础 的 东西 在 物价 中 出 现 的 概率 越 高 。 

可 以 想象 ， 在 中 国 商 场 里 买 件 衣 服 ， 一 般 商 场 标价 都 是 几 千 元 ， 为 什 
么 会 这 么 高 呢 ? 因为 在 这 件 衣服 里 面 ， 切 分 这 块 蛋糕 的 人 太 多 : 第 一 ， 商 
场 要 分 掉 一 块 ， 大 概要 分 掉 四 成 ， 第 二 ， 租 柜台 的 经 销 商 要 分 掉 一 块 ; 第 三 ， 
生产 厂家 又 分 掉 一 块 。 生 产 厂家 有 物流 费用 ， 物 流 中 是 高 速 公路 的 垄断 收 
费 。 生 产 成 本 又 包括 了 在 当地 租房 的 费用 ， 房 租 中 是 政府 垄断 的 土地 费用 。 

在 美国 ， 像 梅 西 百货 销售 的 商品 都 是 自己 直接 采购 的 ， 它 的 利润 就 是 
从 出 厂价 到 零售 价 的 差价 ， 基 本 上 就 是 一 个 公司 在 赚 差 价 。 而 在 中 国 多 了 
个 中 间 商 。 房 租 在 成 本 里 面 占 比 很 大 ， 商 场 有 很 高 的 房租 ， 生 产 厂家 也 有 
很 高 的 房租 ， 两 重 房租 放 在 里 面 。 美 国 则 地 价 便宜 ， 像 梅 西 百货 可 以 开 在 
比较 偏僻 的 Plaza 里 面 ， 甚 至 是 自己 拥有 的 产权 ， 地 价 几 乎 可 以 忽略 不 计 。 

美国 的 资源 在 各 地 配置 比较 均衡 ， 即 使 在 很 偏僻 的 乡镇 ， 也 可 以 享受 
很 高 的 生活 质量 。 甚 至 越 是 偏 的 地 方 ， 生 活 质 量 越 高 ， 原 因 是 汽车 文化 的 
发 达 。 虽 然 地 理 位 置 很 偏 ， 但 是 非常 容易 开车 到 城市 上 班 、 购 物 。 美 国 的 
地 价 很 便宜 ， 可 以 在 任何 一 个 地 方 建造 广场 开店 。 不 管 在 什么 地 方 都 能 买 
到 类 似 的 商品 ， 同 样品 质 、 同 样 价格 。 

对 美国 的 考察 和 思考 的 目的 ， 是 希望 能 为 数据 时 代 的 发 展 指明 方向 。 
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一 个 社会 要 发 展 ， 必 须 是 资源 的 配置 均衡 。 实 现 均衡 ， 其 中 一 个 是 政 
治 制度 上 的 改革 ， 比 如 说 土地 制度 ， 还 有 公用 事业 的 收费 管制 。 本 书 有 专 
门 一 章 会 讲 到 通过 数据 的 公开 和 透明 ， 加 强 社会 对 公用 事业 的 监管 ， 达 到 
有 效 地 降低 基本 收费 的 目的 。 

相对 于 其 他 成 本 ， 土 地 成 本 、 高 速 公路 收费 增加 的 物流 成 本 、 电 力 、 
水 力 垄 断 成 本 ， 这 种 公共 成 本 对 最 终 商 品 成 本 的 增加 有 一 个 累加 效应 ， 对 
物价 的 影响 非常 大 。 通 过 数据 共享 ， 加 大 信息 的 传播 ， 使 不 同 的 地 方 都 能 
得 到 相同 的 信息 ， 使 生产 资源 在 全 国 得 到 均衡 的 分 布 ， 能 够 大 大 降低 成 本 。 


1.6 数据 的 价值 与 变现 


1.6.1 数据 的 变现 


大 数据 已 成 为 新 兴 产 业 的 热点 之 一 ， 但 也 遇 到 很 大 的 问题 ， 就 是 大 数 
据 如 何 变现 的 问题 。 我 们 需要 分 析 一 下 已 知 的 数据 变现 的 案例 ， 才 能 找到 
变现 的 通用 路 径 。 

从 沃尔玛 的 啤酒 和 尿布 的 故事 ， 以 及 现在 购物 网 站 上 的 推荐 ， 可 以 把 
数据 的 变现 分 成 两 个 环节 : 一 个 环节 为 显示 数据 ; 另 一 个 环节 为 决策 。 

在 沃尔玛 的 尿布 和 啤酒 的 故事 中 ， 首 先是 通过 数据 挖掘 发 现 啤酒 的 销 
售 跟 尿布 销售 的 关联 性 ， 由 此 得 到 数据 挖掘 的 一 个 数据 结果 ， 其 次 是 管理 
人 员 根 据 数据 结果 做 出 决策 ， 在 超市 货架 上 将 啤酒 摆 放 在 尿布 的 旁边 ， 因 
此 增加 销售 ， 产 生 额 外 的 效益 。 

同样 ， 从 购物 网 站 的 推荐 的 工作 中 也 可 以 看 出 相似 的 过 程 。 如 果 在 网 
上 点 了 一 个 尿布 ， 网 站 推荐 一 个 啤酒 ， 购 物 者 由 此 获得 数据 挖掘 的 结果 数 
据 ， 但 如 果 购 物 者 不 做 相应 的 决策 ， 即 不 选择 啤酒 ， 而 直接 将 尿布 放 到 购 
物 车 ， 并 最 终 完成 付款 ， 那 么 这 个 数据 挖掘 工作 是 没有 价值 的 。 

由 此 可 见 ， 大 数据 开发 结果 本 身 并 不 能 产生 直接 效益 ， 它 通过 影响 管 


理 层 的 决策 而 产生 间接 效益 。 管 理 人 员 根据 数据 做 出 决策 ， 正 确 的 决策 及 
相应 的 执行 才 产 生 价值 。 如 同 战争 中 正确 的 情报 带 来 的 胜利 。 

一 个 决策 的 影响 ， 大 到 数 十 亿美 元 愉 亏 的 投资 ， 小 到 只 浪费 点 汽油 和 
时 间 的 出 行 。 无 论 政 府 还 是 企业 、 人 个人， 无时无刻 不 在 做 出 各 种 决策 。 每 
个 决策 都 必须 依赖 足够 的 信息 ， 而 信息 都 来 自 数据 。 用 数据 产生 的 结果 引 
导 决 策 ， 可 以 产生 直接 的 效益 。 


1.6.2 决策 产生 价值 


数据 通过 为 决策 提供 支持 而 间接 产生 价值 ， 即 人 们 是 通过 决策 来 实现 
数据 的 价值 。 决 策 离 不 开 可 靠 的 信息 ， 数 据 是 信息 的 主要 来 源 ， 数 据 通 过 
转换 变 为 决策 者 可 利用 的 信息 而 获得 价值 ， 并 且 得 到 回报 。 

决策 可 分 为 自动 决策 和 人 工 决 策 。 自 动 决策 虽然 更 为 直接 和 方便 ， 但 
可 应 用 场合 较 少 ， 更 多 的 为 人 工 决 策 。 所 以 数据 技术 的 本 质 是 将 物理 上 产 
生 的 大 数据 转换 成 人 眼 可 识别 的 小 数据 ， 再 将 小 数据 变 为 大 脑 可 以 快速 直 
观 吸取 的 信息 ， 从 而 产生 它 的 价值 。 

在 互联 网 上 采用 数据 挖掘 就 是 典型 的 大 数据 应 用 。 图 书 电 子 商务 网 站 
会 通过 搜集 消费 者 以 前 的 购物 消费 习惯 ， 对 消费 者 过 去 浏览 过 的 、 购 买 的 
书籍 以 及 在 购买 其 他 商品 的 同时 购买 的 书籍 进行 数据 挖掘 ， 一 般 采 用 的 是 
购物 篮 分 析 算 法 。 当 一 个 新 的 用 户 登 录 网 站 后 选择 了 一 本 书 ， 网 站 后 台 工 
作 程 序 就 可 通过 有 方向 的 数据 挖掘 得 出 相关 书籍 推荐 ， 并 且 在 快速 计算 后 
将 相关 书籍 的 清单 展示 给 该 用 户 ， 实 现 一 对 一 的 推荐 。 

但 是 ， 这 种 后 台数 据 挖掘 的 计算 以 及 书籍 的 推荐 显然 没有 产生 任何 效 
益 ， 只 有 用 户 对 于 网 站 的 自动 推荐 产生 兴趣 ， 点 击 推荐 的 书 并 且 加 入 购物 
车 购买 以 后 ， 整 个 流程 才 会 增加 效益 、 产 生 价值 。 

所 以 ， 真正 变现 的 环节 是 人 的 选择 ， 其 他 的 只 是 参考 。 假 设 有 一 个 人 
知道 网 站 推荐 是 有 目的 的 推荐 ， 从 而 有 意 不 点 击 推荐 项 目 ， 那 么 数据 挖掘 
的 任何 工作 都 不 会 产生 效益 。 由 此 可 以 得 出 ， 大 数据 应 用 最 后 产生 价值 的 
主要 环节 在 于 人 们 的 决策 。 
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在 CCTV2 的 一 期 财经 节目 中 ， 主 持 人 邀请 京东 CEO 刘强 东 和 财经 作 
家 吴 晓 波 一 起 座谈 ， 其 中 提 到 京东 客户 购买 手机 时 从 下 单 到 快递 员 送 货 上 
门 只 需 7 分 钟 ， 其 速度 相当 快 。 

在 这 个 惊人 的 大 数据 应 用 案例 中 ， 京 东 通 过 大 数据 预测 预先 把 手机 派 
送 到 小 区 附近 ， 当 客户 下 单 时 实现 了 迅速 送 货 上 门 。 京 东 是 通过 对 流程 进 
行 分 析 ， 用 大 数据 对 购买 趋势 进行 预测 ， 再 根据 预测 结果 ， 派 送 员 将 货物 
派送 到 小 区 。 由 此 可 见 ， 这 其 中 的 核心 还 是 派送 员 的 决策 。 

作为 一 个 大 数据 在 电 商 行业 的 典型 案例 ， 其 他 行业 难以 直接 模仿 。 这 
些 行业 中 ， 遇 到 的 问题 和 电 商 不 同 ， 数 据 的 作用 不 在 于 如 何 快速 送 货 ， 但 
应 该 可 以 找 出 这 些 行 业 在 日 常 工作 中 的 决策 点 ， 即 需要 决策 的 是 什么 ， 什 
么 能 够 提高 决策 执行 的 速度 ， 做 这 些 决 策 时 需要 什么 数据 ， 能 够 提前 做 什 
么 ， 从 这 些 角度 思考 就 能 发 现 大 数据 的 价值 。 所 以 尽管 其 他 单位 的 工作 场 
景 在 自己 公司 不 能 实现 ， 但 每 个 单位 无 时 无 刻 不 在 做 大 大 小 小 的 决策 。 

所 以 ， 应 该 从 决策 的 角度 分 析 问 题 ， 找 到 很 多 大 数据 的 应 用 领域 。 


1.6.3 数据 的 价值 特点 


作为 决策 支持 工具 的 数据 ， 如 果 把 它 当 作 一 个 产品 ， 它 和 其 他 产品 有 
什么 区 别 呢 ? 

第 一 大 特征 ， 数 据 的 价值 可 有 可 无 ， 可 以 被 利用 也 可 以 被 忽视 。“ 可 
有 可 无 ”是 指数 据 只 是 作为 决策 的 辅助 工具 ， 当 人 在 做 决策 的 时 候 可 以 用 
到 数据 也 可 以 不 用 。 如 同 战争 时 期 ， 不 论 有 无 情报 都 可 以 打仗 ， 区 别 在 于 
是 打 了 胜仗 还 是 打 了 败仗 。 没 有 情报 有 时 也 可 以 打 胜仗 。 在 图 书 电 商 网 站 
买书 ， 无 论 有 没有 推荐 都 可 以 买书 ， 区 别 在 买 多 还 是 买 少 。 没 有 推荐 有 人 
也 会 买 很 多 书 。 数 据 对 决策 的 结果 有 影响 ， 但 对 行为 并 非 必 须 ， 这 是 第 一 
大 特征 。 

第 二 大 特征 , 数量 可 多 可 少 。 数据 越 多 , 决策 的 正确 性 越 高 , 胜算 越 大 ， 
但 这 些 都 不 是 必须 的 ， 很 少 的 关键 数据 也 能 影响 很 大 的 决策 。 

第 三 个 特征 ， 价 值 可 大 可 小 。 即 利用 数据 后 最 小 收益 可 能 开车 在 路 上 








节约 了 10 分 钟 ， 而 最 大 收益 可 能 是 在 一 个 投资 项 目 中 获得 数 十 亿 元 人 民 
币 的 收益 ， 所 以 它 的 价值 具有 不 确定 性 。 

而 其 他 产品 ， 比 如 手机 ， 拥 有 手机 就 可 以 在 移动 状态 下 打 电 话 ， 没 有 
就 不 可 以 ， 有 和 没有 是 两 种 完全 不 同 的 状态 。 


1.6.4 数据 服务 的 商业 模式 


在 数据 时 代 ， 会 出 现 与 数据 有 关 的 新 服务 。 这 些 服务 主要 集中 在 数据 
获取 环节 和 数据 的 增值 服务 环节 。 

第 一 个 环节 为 数据 的 采集 和 储存 。 这 个 工作 主要 负责 采集 数据 ， 或 者 
是 负责 从 不 同 的 数据 源 收集 数据 把 它 集中 起 来 ， 或 者 将 不 可 机 读 的 数据 转 
化 为 可 机 读 。 

第 二 个 环节 为 数据 增值 服务 。 这 个 工作 在 拿 到 数据 之 后 ， 提 供 依赖 于 
数据 的 服务 。 比 如 ， 开 发 一 个 可 以 利用 这 些 数据 的 软件 系统 ， 或 者 把 数据 
和 软件 打包 后 面向 最 终 用 户 提供 云 服务 。 也 有 可 能 只 提供 一 个 解决 方案 ， 
而 数据 由 客户 自己 购买 或 用 客户 自己 的 数据 ， 最 终 客户 直接 将 这 些 数据 用 
于 决策 而 不 需要 二 次 开发 。 

数据 提供 一 般 有 三 种 模式 : 第 一 种 是 提供 最 终 数据 的 查询 ， 提 供 一 个 
满足 检索 条 件 的 数据 集合 ， 需 要 唯一 的 条 件 匹 配 ， 比 如 身份 证 号 码 、 企 业 
代码 证 号 码 ; 第 二 种 是 提供 统计 数据 ， 根 据 查 询 条 件 给 出 统计 数据 ， 但 不 
提供 个 体 数据 ; 第 三 种 是 提供 原始 粒度 的 数据 ， 按 照 本 书 的 介绍 ， 如 若 要 
采用 “ 鹰 眼 ” 技 术 ， 则 必须 采用 原始 粒度 的 数据 进行 分 析 。 

每 一 个 数据 采集 和 服务 商都 不 希望 自己 仅 成 为 一 个 数据 的 提供 者 ， 而 
是 希望 提供 更 多 的 增值 服务 。 但 是 ， 客 户 的 需求 多 种 多 样 ， 难 以 确定 客户 
需要 按 什么 维度 去 统计 。 对 数据 的 汇总 实际 就 是 对 数据 维度 的 裁剪 ， 就 是 
对 数据 有 效 信息 的 过 滤 ， 仅 提供 统计 数据 会 明显 限制 客户 可 以 利用 数据 实 
现 的 功能 ， 也 减 小 了 数据 服务 商 的 市 场 。 

按照 专业 分 工 的 要 求 ， 修 路 就 是 修 路 ， 开 车 就 是 开车 ， 不 可 能 哪 家 公 
司 修了 高 速 公路 还 必须 租 这 家 公司 的 车 才能 在 上 面 走 。 同 理 ， 如 果 数 据 提 
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供 商 要 求 客户 只 能 采购 自己 的 软件 访问 数据 ， 而 自己 的 软件 功能 又 不 能 满 
足 客户 需求 ， 就 会 违反 专业 分 工 的 要 求 ， 路 会 越 走 越 罕 。 

实际 上 ， 卖 数据 是 一 个 很 好 的 商业 模式 。 卖 方 提供 数据 ， 买 方向 卖方 
订购 数据 ， 因 为 数据 是 不 断 更 新 的 ， 所 以 买方 买 的 是 旧 数据 ， 第 二 天 又 会 
购买 新 的 数据 ， 这 种 盈利 模式 没有 问题 。 

数据 服务 商 为 保护 自己 的 数据 资源 ， 最 好 的 方式 不 是 不 允许 别人 把 自 
己 的 数据 装载 到 他 的 服务 器 上 ， 而 是 在 技术 上 提供 更 方便 的 模式 ， 可 以 方 
便 地 直接 访问 放 在 云 服 务 器 上 的 数据 ， 而 不 需要 抽取 数据 。 

根据 数据 仓库 技术 ， 需 要 在 本 地 建立 一 个 数据 仓库 (或 数据 集 市 ) 服 
务 器 ， 把 原始 数据 从 异 构 的 数据 源 中 抽取 过 来 。 如 果 原 始 数据 不 是 关系 数 
据 库 ， 可 能 会 需要 先 建立 一 个 关系 数据 库 ， 将 原始 数据 导入 到 这 个 数据 库 
中 ， 再 通过 编制 的 ETL 程序 把 数据 放 入 数据 仓库 里 。 

这 种 模式 多 了 一 个 比较 麻烦 的 环节 。 如 果 作为 一 个 数据 提供 商 ， 可 以 
提供 一 个 接口 ， 只 要 编制 一 个 SQL 语句 加 上 IP 地 址 和 一 定格 式 参数 ， 直 
接 访问 服务 器 ， 就 可 以 定时 提取 数据 。 这 样 不 仅 提高 了 效率 ， 也 减少 了 客 
户 本 地 服务 器 的 存储 ， 而 数据 提供 商 可 以 在 客户 订购 期 间 提供 数据 访问 服 
务 ， 一 旦 合同 期 限 到 就 终止 数据 访问 ， 形 成 自己 的 商业 模式 。 


1.7 ”信息 时 代 遗 留 的 问题 


1.7.1 缺乏 原始 数据 


如 果 去 研究 一 下 国内 外 出 版 物 ， 特 别 是 有 关 社 会 与 经 济 发 展 的 书籍 ， 
我 们 会 发 现 一 个 共同 点 : 只 有 结论 而 没有 原始 数据 。 

中 国 社会 科学 院 每 年 发 表 一 本 《中 国 城市 竞争 力 报告 》, 设计 各 种 指标 ， 
从 多 个 方面 对 城市 竞争 力 进 行 排名 。 虽 然 研 究 的 价值 和 影响 很 大 ， 但 遗憾 
的 是 未 能 提供 研究 结论 的 原始 数据 。 虽 然 有 些 指 标 可 以 从 其 他 数据 来 源 计 


算 ， 比 如 ， 房 价 收入 比 、 居 民 消 费 购物 场所 数 以 及 人 均 住 房 面积 等 ， 但 还 
有 很 多 指标 并 没有 来 源 。 类 似 的 还 有 很 多 研究 区 域 经 济 发 展 情况 的 文章 或 
书籍 ， 可 能 只 会 给 出 同比 增长 率 的 数据 ， 没 有 提供 计算 这 些 增长 率 的 当期 
和 同期 数据 。 当 然 ， 限 于 文章 或 书籍 的 篇 幅 ， 提 供 全 面 的 数据 比较 困难 ， 
但 如 果 做 一 个 规模 较 大 及 连续 的 研究 ， 开 发 一 个 提供 原始 数据 的 网 站 可 能 
对 社会 能 提供 更 大 的 价值 。 

这 样 的 社会 科学 研究 ， 后 人 无 法 在 这 个 基础 上 进一步 研究 ， 也 无 从 确 
认 研 究 结果 的 真实 性 和 准确 性 。 后 人 的 研究 就 只 能 从 简单 的 数据 收集 开始 ， 
做 大 量 的 重复 工作 。 

《当代 生物 学 》(Current Bio1ogy) 在 2013 年 12 月 发 表 的 一 篇 论文 中 四， 
研究 了 1991 一 2011 年 的 516 篇 文献 ， 发 现在 论文 发 表 20 年 之 后 ， 原 始 数 
据 有 80% 丢失 。 由 此 看 来 ， 人 们 对 原始 数据 的 保存 非常 不 到 位 。 

假设 几 十 年 后 ， 有 人 研究 中 国 改 革 开 放 30 年 的 经 济 发 展 ， 他 除了 这 
些 提 供 间接 数据 的 文章 之 外 ， 将 找 不 到 任何 可 供 研究 的 原始 数据 。 理 论 上 
说 ， 虽 然 我 们 现在 身 处 于 一 个 知识 爆炸 、 信 息 发 达 的 时 代 ， 但 真正 的 实质 
数据 还 是 相当 缺乏 。 

历史 学 家 研究 古代 历史 只 能 靠 发 掘 陵墓 发 现 新 的 文物 ， 从 考古 的 重要 
性 来 说 ， 文 物 肯 定 不 如 文字 ， 比 如 在 陵墓 里 面 发 现 的 甲骨 文 或 者 竹简 ， 它 
上 面 的 信息 价值 要 大 于 文物 本 身 。 

后 人 要 研究 我 们 这 个 时 代 ， 不 能 仅仅 依靠 文字 和 图 片 。 数 据 会 和 文物 、 
书籍 、 绘 画 一 样 ， 成 为 记录 一 个 时 代 的 载体 。 所 以 数据 的 重要 性 显而易见 ， 
我 们 要 注重 保管 好 这 些 数 据 。 


1.7.2 难 搞 的 需求 


阿 基 米 德 说 过 ， 只 要 “给 我 一 个 支点 ， 我 就 可 以 播 动 整个 地 球 ”。 程 
序 员 也 说 ， 只 要 给 我 一 个 需求 ， 我 可 以 开发 任何 软件 。 

实际 上 ， 程 序 员 说 的 需求 ， 不 是 简单 的 “一 个 需求 ”， 而 是 包括 如 何 
满足 需求 的 设计 。 这 个 需求 一 般 包括 想 要 什么 功能 ， 操 作 流程 如 何 ， 甚 至 
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程序 界面 如 何 布局 。 很 多 软件 公司 和 程序 员 以 此 作为 骄傲 ， 证 明 自 己 的 技 
术 很 强 。 

如 果 在 建筑 行业 ， 一 个 建筑 工人 可 能 会 说 ， 只 要 设计 师 能 设计 出 房子 
我 就 能 建造 出 来 。 这 里 的 设计 不 仅仅 是 一 个 简单 的 需求 ， 或 者 简单 的 设计 
概念 图 ， 肯 定 包括 详细 的 尺寸 、 材 料 等 。 有 了 设计 ， 对 于 建筑 工人 来 说 确 
实 简单 了 ， 但 设计 才 是 困难 所 在 。 

因此 ， 在 信息 系统 开发 中 ， 需 求 是 一 个 比较 困难 的 问题 。 

在 一 般 的 事务 处 理 软件 开发 中 ， 一 个 软件 实际 上 是 把 现实 中 由 人 工 处 
理 的 流程 转移 到 计算 机 上 来 ， 而 人 工 处 理 流程 常常 是 运作 多 年 的 成 熟 流程 。 
在 一 个 实施 信息 化 初期 的 单位 ， 可 能 只 是 希望 用 计算 机 实现 原来 手工 处 理 
的 流程 ， 所 以 它 可 以 详细 描述 原来 手工 处 理 的 流程 ， 作 为 一 个 需求 。 

随 着 信息 化 水 平 的 提高 ， 很 多 客户 不 再 满足 自己 提出 需求 ， 觉 得 自己 
的 管理 不 够 完善 ， 希 望 借鉴 别人 比较 先进 的 流程 ， 学 习 其 他 领先 公司 的 管 
理 。 因 此 ， 越 来 越 多 公司 倾向 购买 现成 的 成 熟 软件 。 

实际 上 ， 中 国人 和 日 本 人 一 样 ， 还 是 比较 喜欢 完全 按照 自己 的 流程 来 
定制 软件 ， 而 美国 人 就 不 太一 样 ， 他 们 比较 喜欢 用 现成 的 软件 ， 这 种 偏好 
实际 上 反映 了 流程 运作 的 规范 化 程度 。 

但 是 ， 在 DSS 决策 支持 系统 ) 开发 中 是 没有 需求 的 。 因 为 在 日 常 的 
工作 中 ， 并 没有 决策 支持 的 标准 流程 ， 毕 竟 需 要 决策 的 事件 都 是 随机 发 生 
的 ， 所 以 也 没有 标准 的 处 理 流程 。 

按照 一 般 事务 处 理 软件 开发 的 逻辑 ， 既 然 没 有 流程 也 就 没有 需求 ， 没 
有 需求 也 就 无 法 描述 给 软件 开发 人 员 ， 开 发 人 员 也 因此 无 法 开发 软件 ， 即 
使 开发 出 来 也 需要 经 常 修改 以 满足 客户 不 断 变化 的 需求 。 

那么 ， 如 何在 没有 需求 的 情况 下 开发 DSS 系统 呢 ? 主要 技术 在 于 数据 
模型 的 使 用 和 对 数据 源 的 研究 。 

数据 模型 是 前 人 总 结 众多 需求 得 出 的 ， 因 此 ， 一 个 客户 的 需求 一 般 都 
能 从 模型 中 推导 出 来 。 

DSS 开发 基础 是 现 有 的 数据 源 。 数 据 源 来 自 客 户 的 事务 处 理 系统 ， 事 
务 处 理 系统 包含 了 客户 的 需求 。 客 户 要 看 什么 数据 、 不 要 看 什么 数据 ， 在 


数据 源 中 都 有 体现 。 他 需要 看 的 数据 ， 肯 定 已 经 录入 数据 库 。 如 果 没有 这 
个 数据 ， 就 说 明 他 不 需要 看 这 个 数据 ， 和 否则 需要 先 修改 事务 处 理 软件 ， 增 
加 该 数据 的 录入 功能 。 

科学 研究 方法 有 归纳 法 和 演绎 法 。 原 来 我 们 用 的 可 能 更 多 是 归纳 法 ， 
也 就 是 从 需求 到 软件 开发 ， 而 现在 用 到 演绎 法 ， 必 须 从 模型 去 推导 需求 。 


1.7.3 自助 分 析 的 陷阱 


在 商业 智能 (BI) 领域 里 ，2016 年 发 生 了 一 个 比较 大 的 变化 ， 由 
Gartner 公司 做 的 魔力 象限 把 原来 经 典 的 品牌 如 SAP、IBM、SAS 等 都 降 
到 了 有 远见 者 的 象限 ， 而 只 在 领导 力 象限 留 下 了 三 个 品牌 ， 包 括 Tableau 
和 Qlik。 

这 个 调整 ， 把 BI 的 方向 导向 了 自助 分 析 ， 如 果 说 BI 以 前 是 由 IT 部 门 
主导 ， 现 在 则 以 业务 部 门 主导 。 

但 是 ， 自 助 分 析 是 不 是 未 来 的 方向 呢 ? 笔者 认为 不 是 。 

现在 来 分 析 一 下 自助 分 析 的 实质 。 举 个 吃饭 的 例子 ， 有 两 种 自助 方式 ， 
一 种 是 自助 餐 的 形式 ， 另 外 一 种 是 DIY 厨房 式 的 形式 。 自 助 餐 就 是 所 有 的 
菜 都 已 经 做 好 了 ， 你 只 要 拿 答 子 和 勺子 就 可 以 直接 吃 ， 而 DIY 厨房 式 只 提 
供 厨 房 ， 需 要 自己 去 买 菜 做 ， 但 可 以 做 出 任何 自己 想 吃 的 菜 ， 加 任何 自己 
想 加 的 调料 。 

显然 , 现在 在 BI 里 面 的 自助 是 第 二 种 “DIY 厨房 式 ” 的 自助 。 也 就 是 说 ， 
它 只 是 提供 了 一 种 工具 ， 业 务 部 门 的 人 员 可 以 用 它 做 出 很 漂亮 的 图 形 ， 但 
数据 必须 自己 处 理 ， 图 形 必 须 自己 选择 ， 需 求 也 是 根据 自己 的 业务 需要 去 
设计 。 这 种 自助 对 人 员 的 要 求 相对 来 说 比较 高 ， 起 码 要 熟悉 自助 分 析 的 软 
件 。 虽 然 这 种 软件 非常 方便 ， 也 很 直观 ， 但 毕竟 需要 学 习 。 

但 是 ， 仅 仅 靠 这 个 软件 并 不 能 解决 BI 所 面临 的 问题 ， 比 如 说 大 数据 的 
问题 ， 如 何 用 很 少时 间 从 一 个 大 的 数据 集中 提取 分 类 合计 数据 。 像 Tableau 
这 种 自助 分 析 的 工具 ， 实 际 上 只 能 面向 一 个 有 限 的 数据 集 ， 它 的 起 点 是 打 
开 一 个 数据 平面 文件 , 或 者 用 一 个 SQL 语言 或 MDX 语言 得 到 一 个 二 维 表 ， 
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也 就 是 说 ， 它 提取 的 是 一 个 有 限 的 数据 集 ， 这 个 数据 集 要 放 在 内 存 中 ， 它 
的 所 有 的 分 析 都 是 在 数据 集 的 基础 上 进行 分 析 。 这 个 数据 集 开 始 是 以 一 个 
二 维 表 的 方式 给 出 的 ， 虽 然 可 以 通过 建立 层次 结构 来 变 成 三 维 或 多 维 ， 但 
总 的 基础 是 一 个 二 维 表 。 

这 种 自助 不 是 完全 的 自助 ， 我 们 想 拥 有 像 自 助 餐 一 样 的 自助 ， 就 需要 
把 “ 菜 ” 完 全 做 好 , 也 就 是 说 , 把 数据 和 需求 都 处 理 好 , 才能 解决 这 个 问题 。 

自助 分 析 最 终 的 目标 应 该 是 业务 人 员 可 以 在 自己 的 计算 机 上 看 到 数 
据 ， 而 他 的 主要 工作 是 去 理解 数据 变化 的 含义 ， 关 注 数据 的 趋势 和 不 同 指 
标 之 间 的 关系 ， 从 不 同 的 维度 观察 同样 的 指标 ， 分 析 它 的 同比 、 环 比 等 。 

总 而 言 之 ， 自 助 分 析 应 该 让 业务 人 员 不 要 去 考虑 数据 如 何 获取 ， 也 不 
要 考虑 数据 如 何 表现 ， 重 点 是 理解 数据 。 而 且 ， 数 据 应 该 是 来 自 一 个 很 大 
的 数据 集 ， 甚 至 是 来 自 多 元 的 、 异 构 的 数据 集 ， 但 对 使 用 者 而 言 这 些 东西 
应 该 是 透明 的 。 

如 果 准 确定 义 的 话 ，Tableau 这 类 工具 应 该 是 自助 分 析 的 工具 ， 自 助 分 
析 系 统 是 专门 的 人 利用 这 种 工具 开发 完成 的 。 当 然 ， 做 真正 的 自助 分 析 时 
有 这 类 工具 也 是 非常 方便 的 ， 毕 竟 ， 这 让 业务 人 员 可 以 离开 IT 人 员 去 完成 
比较 简单 的 分 析 ， 应 该 来 说 是 很 大 的 进步 。 

Gartner 公司 的 魔力 象限 说 明 ， 现 在 国际 上 BI 的 发 展 方向 和 前 沿 技术 
是 自助 分 析 工 具 ， 至 于 真正 的 自助 分 析 系 统 ， 则 还 有 一 定 的 距离 。 

自助 分 析 系 统 实现 虽然 不 能 由 业务 人 员 独 立 实 现 ， 但 可 以 为 业务 人 员 
提供 的 方便 性 和 强大 的 功能 是 自助 分 析 工 具 所 不 具备 的 。 


1.7.4 难以 满足 的 客户 


为 什么 客户 总 是 不 太 满 意 定制 开发 的 信息 系统 呢 ? 

众所周知 ， 当 一 个 客户 决定 购买 一 个 信息 系统 时 ， 信 息 系统 的 供应 商 
会 给 客户 描述 系统 拥有 的 功能 ， 这 些 功 能 除了 满足 一 般 事务 处 理 的 需求 以 
外 ， 更 多 的 是 描述 完成 以 后 对 决策 支持 的 帮助 。 

因为 一 般 信息 系统 的 采购 是 由 高 层 管理 者 决定 ， 而 不 是 由 底层 业务 人 


员 决 定 ， 所 以 高 层 管理 者 更 多 的 关注 信息 系统 完成 以 后 对 决策 支持 的 作用 ， 
而 信息 系统 供应 商 为 投 其 所 好 ， 会 从 高 层 管理 者 的 角度 描述 产品 的 功能 。 

但 当 信 息 系 统 实际 完成 投入 使 用 以 后 ， 购 买 决 策 者 会 发 现 它 的 实际 功 
能 与 供应 商 的 描述 及 其 自身 的 心理 定位 都 有 较 大 差距 ， 从 而 产生 不 满 。 供 
应 商 为 兑现 自己 的 承诺 ， 满 足 客户 的 需求 ， 会 按照 客户 需求 开发 一 些 定制 
报表 ， 制 作 少 部 分 装饰 门面 的 统计 图 形 。 但 这 些 程序 运行 速度 比较 慢 ， 缺 
乏 总 体 的 一 致 性 ， 其 实 是 对 客户 的 敷衍 ， 不 仅 达 不 到 客户 的 需求 ， 还 会 花 
费 大 量 的 精力 和 成 本 。 

问题 产生 的 根本 原因 在 于 供需 双方 都 把 决策 支持 和 事务 处 理 混 为 一 
谈 ， 低 估 了 决策 支持 的 难度 。 供 应 商 由 于 技术 限制 ， 即 使 在 知道 决策 支持 
难 做 的 情况 下 ， 也 只 能 从 现 有 的 技术 出 发 进行 开发 。 

事务 系统 和 决策 支持 系统 是 两 种 不 同 的 系统 ， 不 但 开发 的 流程 不 同 ， 
使 用 的 技术 和 工具 软件 也 不 同 ， 甚 至 服务 器 都 不 能 合用 。 好 比 买 房子 ， 建 
房 和 装潢 是 两 个 专业 的 事情 ， 不 能 要 求 房 屋 开发 公司 同时 也 是 一 个 非常 好 
的 装 江 公 司 。 

信息 系统 采购 商 和 供应 商 之 间 的 误解 ， 可 以 用 一 个 外 国人 来 中 国 买房 
子 的 场景 来 比喻 ， 一 个 对 中 国 房地产 市 场 一 无 所 知 的 外 国人 想 买 房子 ， 当 
房产 商 带 他 去 参观 样板 房 时 ， 精 致 的 样板 房 装修 营造 的 舒适 的 生活 环境 打 
动 了 他 , 他 会 认为 这 就 是 他 要 买 的 房子 , 即 所 谓 的 精装 修 房 , 从 而 顺利 签约 。 
等 到 交房 时 ， 这 个 外 国人 发 现 却 只 是 一 个 毛坯 房 ， 与 他 想象 中 的 房子 有 很 
大 差异 ， 从 而 与 房产 开发 商 产生 纠纷 ， 要 求 房产 开发 商 按照 样板 房 交付 。 
产生 纠纷 的 原因 可 能 是 房产 商 当时 并 没有 说 清楚 ， 也 可 能 他 没有 理解 房 地 
产 商 口中 的 毛坯 房 和 他 看 到 的 样板 房 有 这 么 大 的 区 别 。 

如 果 房 产 商 决 定 迁就 外 国 购房 者 的 要 求 ， 按 照 他 的 要 求 进行 精装 修 ， 
但 由 于 他 们 对 装潢 缺乏 总 体 设 计 ， 即 使 能 提供 一 些 基础 设备 也 达 不 到 样板 
房 的 效果 。 

在 建设 信息 系统 时 ， 供 应 商 描述 的 功能 类 似 样板 房 ， 等 实际 交付 时 用 
户 发 现 却 是 毛坯 房 ， 从 而 产生 纠纷 。 如 果 一 个 组 织 的 负责 人 从 来 没有 参与 
过 信息 系统 的 采购 , 他 将 难以 分 辨 出 哪些 是 供应 商 对 前 景 的 描述 (样板 房 )， 
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哪些 是 供应 商 实际 能 够 提供 的 功能 (毛坯 房 )。 

总 体 而 言 ， 任 何 信息 系统 都 是 由 事务 处 理 和 决策 支持 两 部 分 组 成 。 这 
就 像 买房 子 一 样 ， 一 个 是 房产 商 提 供 ， 另 一 个 是 装修 公司 提供 ， 必 须 由 不 
同 的 供应 商 提供 。 而 最 关键 的 问题 在 于 ， 现 在 一 般 的 事务 系统 供应 商 并 不 
掌握 决策 支持 所 用 的 技术 ， 这 两 种 技术 是 完全 不 同 的 。 

如 果 一 些 事务 处 理 系统 能 够 和 决策 支持 系统 结合 ， 那 么 对 客户 的 而 言 
能 够 提供 更 大 的 价值 ， 并 且 可 以 避免 客户 验收 的 后 期 在 报表 上 与 他 纠缠 ， 
避免 造成 花费 大 量 的 人 力 物 力 后 还 是 不 能 满足 客户 需求 的 后 果 。 

因为 报表 系统 是 二 维 的 表 ， 虽 然 用 了 比较 复杂 的 嵌 套 表 头 ， 但 它 还 是 
一 种 局 限于 二 维 的 数据 展示 工具 ， 另 外 由 于 它 没有 图 形 ， 很 多 时 候 合计 速 
度 比 较 慢 ， 难 以 担当 决策 支持 系统 的 重任 。 


1.7.5 完全 不 一 样 的 需求 


在 计算 机 出 现 的 早期 ， 人 类 对 计算 机 能 够 实现 的 功能 只 有 一 个 模糊 的 
需求 。 当 一 个 计算 机 业内 人 士 向 圈 外 人 描述 计算 机 功能 的 时 候 ， 他 会 把 可 
以 随意 浏览 的 数据 和 将 数据 可 视 化 当成 一 种 基本 功能 ， 但 这 种 看 似 简 单 的 
需求 在 信息 技术 革命 已 经 结束 时 仍然 没有 得 以 实现 。 人 们 最 初 认为 ， 需 求 
只 有 一 类 ， 并 可 以 通过 相同 的 技术 来 解决 ， 但 后 来 经 专家 研究 后 发 现 这 
种 模糊 的 需求 必须 分 为 两 类 : 一 类 是 事务 处 理 ， 另 一 类 是 决策 支持 。 由 于 
这 两 类 需求 对 技术 的 要 求 不 一 样 ， 所 以 需要 采取 不 同 的 技术 来 解决 。 

经 过 几 十 年 的 发 展 以 后 ， 事 务 处 理 方面 的 需求 得 到 很 大 的 满足 ， 这 也 
导致 了 现在 大 量 的 计算 机 应 用 都 局 限于 事务 处 理 ， 而 决策 支持 这 块 的 需求 
由 于 适用 技术 缺乏 而 被 忽视 。20 世纪 90 年 代 才 出 现 相关 的 数据 仓库 技术 ， 
并 且 在 该 技术 基础 上 开发 出 大 量 的 商业 智能 软件 ， 包 括 ETL、OLAP 以 及 
图 形 展示 工具 。 但 是 ， 商 业 智 能 软件 在 火爆 一 段 时 间 后 ， 在 实际 应 用 上 并 
未 获得 市 场 的 认可 ， 导 致 现在 这 方面 的 应 用 仍然 非常 落后 。 

因此 ， 计 算 机 发 明 伊始 ， 人 类 基于 希望 的 两 类 功能 迄今 为 止 上 只 满足 了 
一 个 ， 另 一 个 仍然 缺失 。 根 本 原因 在 于 ， 两 类 功能 都 把 客户 需求 当 作 开发 


的 前 提 条 件 。 实 际 上 ， 在 数据 仓库 的 创始 人 比尔 。 恩 门 的 书 中 外 已 经 明确 
说 到 ， 这 两 类 应 用 的 最 大 区 别 是 : 事务 处 理 是 先 有 需求 后 有 开发 ， 而 决策 
支持 是 先 有 开发 后 有 需求 。 

虽然 拥有 了 商业 智能 的 技术 和 软件 ， 但 一 方面 ， 由 于 大 多 数 从 事 商 业 
智能 软件 开发 的 技术 人 员 都 是 从 事务 处 理 软件 开发 转 过 来 的 ， 而 且 很 多 项 
目 对 这 两 类 功能 没有 明确 分 割 ， 所 以 技术 人 员 存 在 固定 思维 习惯 ， 必 须要 
先 有 需求 才能 进行 开发 ， 非 常 不 适应 没有 需求 的 开发 。 另 一 方面 ， 虽 然 数 
据 仓库 的 理论 里 有 很 多 的 技术 可 以 应 用 《比如 维度 模型 ) ， 但 熟悉 这 方面 
技术 的 人 非常 少 ， 没 有 人 能 找 出 进行 无 需求 开发 的 方法 ， 所 以 难以 应 对 没 
有 客户 需求 的 开发 。 

只 有 充分 利用 数据 仓库 的 维度 模型 ， 把 维度 模型 的 价值 充分 发 挥 出 来 ， 
通过 过 度 设 计 、 模 型 推导 来 应 对 可 能 出 现 的 各 种 各 样 需 求 ， 才 可 能 实现 无 
需求 的 开发 。 


1.7.6 心 有 余 而 力 不 足 的 数据 挖掘 


经 过 多 年 的 努力 ， 很 多 公司 在 商业 智能 的 开发 中 开发 出 许多 相关 的 产 
品 ， 最 后 由 大 的 IT 公司 ,例如 ，IBM、SAP、 微 软 、Oracle 进行 收购 整合 ， 
形成 完整 解决 方案 。 

目前 ， 商 业 智能 软件 或 者 BI 软件 开发 和 整合 高 潮 已 经 过 去 ， 很 少 再 看 
到 新 的 技术 出 现 。 但 BI 软件 的 应 用 也 没有 取 到 预想 的 效果 。 从 市 场 反馈 
的 信息 看 , 成 功 实施 BI 的 公司 很 少 。 表面 是 由 于 价格 昂贵 而 客户 的 需求 少 ， 
实际 上 是 实施 失败 率 高 才 导 致 的 价格 昂贵 ， 因 此 价格 高 只 是 一 个 结果 而 不 
是 原因 。 

纵 观 整个 商业 智能 软件 体系 ， 可 以 发 现 ， 软 件 开 发 将 数据 挖掘 作为 商 
业 智 能 发 挥 作用 的 一 个 主要 方向 。 即 在 整个 商业 智能 技术 方案 架构 中 ， 
ETL 或 OLAP 都 是 内 部 的 一 种 技术 实现 ， 而 展示 和 数据 挖掘 是 最 终 向 用 户 
展示 效果 的 主要 手段 。 

但 是 ， 用 户 对 BI 展示 和 数据 挖掘 效果 都 不 太 认 可 。 主 要 原因 是 数据 
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挖掘 对 需求 的 要 求 比较 高 ， 展 示 开 发 也 是 根据 需求 来 进行 的 。 一 般 数 据 挖 
掘 属于 有 方向 的 数据 挖掘 ， 必 须 按照 需求 来 进行 ， 而 这 方面 需求 在 决策 支 
持 系统 的 理论 上 ， 一 开始 就 认定 没有 需求 ， 从 而 为 成 功 设 定 了 高 门槛 。 

对 于 用 户 来 说 ， 进 行 何 种 决策 是 不 确定 的 ， 因 此 无 法 确定 需求 的 具体 
内 容 和 需求 的 使 用 频率 。 即 使 能 有 需求 ， 也 只 能 满足 用 户 常 见 的 、 可 重复 
的 场景 ， 这 种 场景 对 用 户 来 说 价值 非常 低 。 在 用 固定 的 算法 进行 数据 挖掘 
时 ， 对 需求 的 限定 范围 更 窄 ， 相 应 可 应 用 的 场景 也 就 更 少 。 

从 微软 公司 的 开发 历史 来 看 ， 微 软 公司 从 SQL Server 2000 开始 支持 
商业 智能 功能 ， 随 后 在 SQL Server 2005 开发 出 一 套数 据 控 掘 工具 ， 实 际 
上 是 对 数据 挖掘 中 的 某 些 算法 给 予 了 支持 ， 但 在 后 来 的 版 本 中 则 对 数据 挖 
掘 没有 进一步 开发 。 其 原因 很 简单 ， 它 能 提供 的 数据 挖掘 算法 太 少 ， 不 能 
满足 客户 的 需求 。 数 据 挖掘 成 熟 的 算法 很 少 ， 适 应 面 也 很 狭隘 ， 微 软 又 仅 
仅 实现 其 中 很 小 的 一 部 分 算法 ， 众 多 的 限制 使 其 可 应 用 的 场景 非常 少 ， 因 
此 微软 停止 了 对 数据 挖掘 软件 包 的 开发 。 

现在 数据 挖掘 方面 发 展 最 好 的 就 是 “R 语言 ”， 由 于 它 是 一 个 开源 
的 系统 ， 故 而 很 多 人 在 这 里 提供 数据 挖掘 的 新 算法 并 且 可 由 他 人 进行 
修改 ， 因 此 它 带 的 数据 挖掘 软件 包 很 多 ， 算 法 资源 非常 丰富 ， 适 应 性 非 
常 广 。 

由 于 数据 挖掘 算法 的 复杂 性 ， 没 有 哪 家 公司 或 者 个 人 可 以 推导 出 一 个 
有 限 的 数据 挖掘 算法 集合 。 就 像 苹 果 公 司 只 能 开发 手机 ， 而 无 法 垄断 APP 
开发 ， 因 为 它 无 法 预测 什么 样 的 APP 受 欢 迎 ， 因 此 它 聪明 地 只 提供 开发 环 
境 和 App Store， 而 让 其 他 的 开发 者 去 开发 软件 。 同 样 ， 数 据 挖掘 算法 也 和 
APP 一 样 ，“R 语言 ”实际 上 是 一 个 开放 的 环境 ， 任 何人 都 可 以 写 自己 数 
据 挖掘 的 算法 给 别人 使 用 ， 其 中 不 乏 一 些 经 典 的 算法 非常 实用 ， 但 这 也 会 
对 用 户 提出 更 高 的 要 求 ， 有 很 多 的 参数 需要 设置 。 另 外 ， 也 不 乏 有 些 人 鱼 
目 混 珠 ， 发 表 错 误 的 数据 挖掘 算法 ， 所 以 如 果 要 用 这 个 算法 必须 经 过 自己 
的 检验 ， 这 样 虽然 提升 了 使 用 的 门槛 ， 但 这 确实 是 在 现 有 的 技术 环境 下 数 
据 挖掘 最 好 的 解决 方案 。 

实际 上 ， 针 对 数据 挖掘 最 好 的 方法 ， 就 是 通过 统计 汇总 之 后 将 大 数据 


变 成 小 数据 ， 随 后 导出 标准 的 格式 〈 如 CSV 格式 ) ， 之 后 通过 “R 语言 
建立 数据 挖掘 的 模型 ， 从 而 输出 图 形 ， 若 这 些 图 形 可 以 变 成 页 面 和 其 他 的 
功能 一 起 调用 ， 就 能 基本 上 满足 客户 的 需求 。 


1.7.7 跳出 事务 处 理 的 红海 


信息 技术 革命 经 过 几 十 年 的 发 展 ， 软 件 的 数量 越 来 越 多 ， 并 且 重 要 性 
也 越 来 越 大 。 人 们 普遍 认为 ， 以 后 的 世界 将 是 一 个 软件 定义 的 世界 ， 以 后 
所 有 的 技术 和 设备 的 大 部 分 功能 都 将 依赖 软件 来 实现 。 比 如 说 ， 智 能 手机 
里 肯定 含有 很 多 硬件 ， 但 智能 手机 功能 的 强 弱 并 不 是 由 硬件 决定 的 ， 而 是 
由 它 上 面 运行 的 APP 软件 来 决定 的 。 

在 人 们 看 到 这 么 多 的 软件 ， 并 认识 到 它 的 重要 性 以 后 ， 会 产生 一 种 错 
觉 , 认为 软件 已 经 非常 丰富 甚至 过 剩 。 它 的 品种 如 此 之 多 , 涉及 面 如 此 之 广 ， 
如 果 说 目前 软件 还 有 不 足 的 话 ， 肯 定 不 会 被 人 认可 。 如 同一 个 人 身 处 闹市 
的 中 心 时 ， 看 到 周围 都 是 人 ， 会 产生 一 种 错觉 ， 以 为 满 世界 都 是 人 ， 已 经 
人 满 为 患 了 。 实 际 上 ， 如 果 有 机 会 乘 直升机 从 人 和 群 中 往 上 飞 ， 开 始 高 度 低 
的 时 候 ， 在 视野 中 还 是 有 很 多 人 ， 但 当 升 到 一 定 高 度 ， 就 会 发 现 人 都 集中 
在 市 中 心 一 块 区 域 中 ， 除 了 市 中 心 以 外 ， 周 边 还 有 很 大 的 空地 ， 人 非常 少 。 
同样 ， 在 软件 行业 ， 也 有 这 样 的 一 个 感觉 : 如 果 自 己 想 开 发 一 个 软件 产品 ， 
就 会 发 现 相似 的 软件 产品 已 经 非常 多 ， 但 如 果 跳 出 这 个 圈子 ， 会 发 现 大 部 
分 的 软件 其 实 都 可 以 归 为 一 类 ， 叫 事务 处 理 软件 。 

实际 上 ， 除 事务 处 理 软件 外 ， 还 有 一 类 软件 ， 叫 决策 支持 系统 ， 却 很 
少 能 看 到 这 类 软件 。 在 组 织 做 信息 系统 规划 的 时 候 ， 大 家 常常 把 决策 支持 
系统 和 事务 处 理 软件 混为一谈 ， 搞 得 整体 架构 非常 混乱 ， 关 系 也 非常 复杂 。 
事实 上 ， 决 策 支持 系统 和 事务 处 理 软件 是 一 个 双生 关系 ， 而 不 是 互 不 相关 
的 两 种 类 型 软件 ， 即 每 一 种 事务 处 理 软件 的 数据 都 需要 相应 的 决策 支持 系 
统 处 理 ， 并 不 会 因为 有 了 事务 处 理 软件 就 不 要 决策 支持 系统 了 ， 或 者 有 了 
决策 支持 系统 就 不 要 事务 处 理 软件 。 

所 以 , 一 般 组 织 需 要 做 两 个 信息 系统 规划 : 一 个 是 事务 处 理 软件 规划 ; 
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另 一 个 是 决策 支持 系统 规划 。 决 策 支持 系统 是 基于 数据 的 一 种 规划 ， 用 于 
指导 事务 处 理 软件 的 开发 。 

从 软件 的 分 类 来 说 ， 事 务 处 理 软件 是 一 片 红海 ， 而 决策 支持 系统 是 蓝 
海 。 现 在 一 般 软件 公司 开发 事务 处 理 软件 ， 如 果 它 仅仅 掌握 软件 技术 是 远 
远 不 够 了 ， 还 必须 对 业务 流程 非常 熟悉 ， 必 须 有 开发 经 验 才 可 能 被 用 户 认 
可 ， 而 现在 掌握 决策 支持 系统 技术 的 人 才 相对 比较 少 。 


第 2 章 


认识 数据 革命 


大 数据 是 以 容量 大 、 类 型 多 、 
存 取 速 度 快 、 应 用 价值 高 为 主要 特征 
的 数据 集合 ， 正 快速 发 展 为 对 数量 巨 
大 、 来 源 分 散 、 格 式 多 样 的 数据 进行 
采集 、 存 储 和 关联 分 析 ， 从 中 发 现 新 
知识 、 创 造 新 价值 、 提 升 新 能 力 的 新 
一 代 信 息 技术 和 服务 业态 。 
国务 院 《促进 大 数据 发 展 行动 
纲要 》 
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2.1 认识 数据 


2.1.1 数据 分 类 


这 里 的 数据 指 的 全 样 数据 ， 而 不 是 抽样 数据 。 有 的 数据 不 能 达到 大 数 
据 的 要 求 ， 仍 然 需 要 被 处 理 、 认 知 。 

大 数据 是 一 种 特定 的 数据 ， 它 所 需要 的 处 理 技 术 和 方法 和 一 般 数 据 不 
同 。 麦 肯 锡 全 球 研究 所 给 出 的 定义 是 :一 种 规模 大 到 在 获取 、 存 储 、 管 理 、 
分 析 方 面 大 大 超出 了 传统 数据 库 软 件 工 具 能 力 范围 的 数据 集合 ， 具 有 海量 
的 数据 规模 、 快 速 的 数据 流转 、 多 样 的 数据 类 型 和 价值 密度 低 四 大 特征 。 

数据 按 格式 分 为 结构 化 数据 和 非 结 构 化 数据 。 非 结构 化 数据 是 大 数据 
技术 发 展 的 一 个 重点 ， 但 越 来 越 多 的 人 把 声音 、 图 片 、 视 频 归 于 非 结 构 化 
数据 ， 增 加 了 大 数据 的 复杂 性 。 非 结构 化 数据 应 该 只 包括 办 公文 档 、 文 本 、 
JSON、XML、HTML 等 〈 也 称 为 半 结 构 化 数据 ) ， 而 声音 、 图 片 、 视 频 
应 该 归于 多 媒体 数据 。 非 结构 化 数据 划分 比较 粗放 的 原因 可 能 是 目前 大 数 
据 技术 仅 实现 了 大 数据 的 存储 ， 还 没有 实现 对 大 数据 的 分 析 ， 如 果 深 入 对 
大 数据 进行 分 析 后 ， 就 会 发 现 这 些 数据 之 间 有 比较 大 的 区 别 。 与 其 他 数据 
相 比 ， 从 多 媒体 数据 中 现在 无 法 提取 可 以 进行 统计 分 析 的 特征 。 一 种 可 能 
的 前 景 是 , 通过 深度 学 习 , 从 多 媒体 数据 中 提取 特征 , 保存 到 结构 化 数据 中 ， 
同 其 他 结构 化 数据 一 起 分 析 ， 最 后 钻 透 至 原始 数据 级 别 ， 播 放 或 显示 相应 
的 多 媒体 数据 文件 内 容 。 

从 数据 量 来 说 ， 多 媒体 数据 量 最 大 ， 非 结构 化 数据 数据 量 次 之 ， 结 构 
化 数据 量 最 小 。 从 数据 含金量 来 看 ， 结 构 化 数据 的 含金量 最 高 ， 对 组 织 的 
价值 更 大 ， 非 结构 化 数据 次 之 。 


数据 可 以 按 来 源 分 为 内 部 数据 和 外 部 数据 ， 内 部 数据 来 源 组 织 内 部 的 
信息 系统 ， 数 据 真 实 、 及 时 、 准 确 、 详 细 ， 使 用 没有 数据 隐私 问题 ， 也 无 
须 费用 。 外 部 数据 可 以 来 自 网 上 公开 的 数据 ， 比 如 上 市 公司 的 定期 报告 ， 
也 可 能 购买 自 第 三 方 数 据 提供 商 。 

从 数据 的 使 用 对 象 分 ， 有 内 部 用 户 和 外 部 用 户 ， 对 外 部 用 户主 要 要 保 
护 好 数据 隐私 。 

对 数据 的 应 用 基本 上 是 以 上 分 类 的 一 种 组 合 。 


2.1.2 数据 来 源 和 存储 


数据 是 信息 技术 的 产物 ， 人 类 只 有 计算 机 诞生 后 ， 才 能 如 此 方便 、 大 
量 地 生成 数据 。 

数据 的 第 一 个 来 源 是 人 们 通过 计算 机 及 上 面 运行 的 软件 输入 的 数据 ， 
比如 在 企业 ERP 或 者 OA 等 应 用 软件 上 输入 的 数据 ， 在 社交 网 站 上 输入 的 
数据 ， 这 是 人 们 有 意识 、 有 目的 地 输入 数据 。 

数据 的 第 二 个 来 源 是 人 们 在 操作 软件 时 留 下 的 痕迹 ， 比 如 网 站 的 日 志 。 

数据 的 第 三 个 来 源 是 机 器 运行 时 自动 产生 的 数据 ， 比 如 物 联 网 或 者 是 
DCS 控制 系统 产生 的 数据 。 

数据 存储 方式 分 为 在 线 存储 、 离 线 存 储 和 近 线 存储 。 

在 线 存储 是 指 存储 设备 和 所 存储 的 数据 时 刻 保持 “在 线 ” 状 态 ， 可 供 
用 户 随 意 读 取 ， 满 足 计算 平台 对 数据 访问 的 速度 要 求 。 就 像 PC 中 常用 的 
磁盘 存储 模式 一 样 。 一 般 在 线 存储 设备 为 磁盘 和 磁盘 阵列 等 ， 价 格 相对 昂 
贵 ， 但 性 能 较 好 。 

离线 存储 是 对 在 线 存 储 数据 的 备份 ， 以 防范 可 能 发 生 的 数据 “灾难 ”。 
离线 存储 的 数据 不 常 被 调用 ， 一 般 也 远离 系统 应 用 ， 所 以 人 们 用 “离线 ” 
来 生动 地 描述 这 种 存储 方式 。 

离线 存储 介质 上 的 数据 在 读 写 时 是 顺序 进行 的 。 当 需要 读 取 数 据 时 ， 
需要 把 磁带 卷 到 头 ， 再 进行 定位 。 当 需要 对 已 写 入 的 数据 进行 修改 时 ， 所 
有 的 数据 都 需要 全 部 进行 改写 。 因 此 ， 离 线 存 储 的 访问 速度 慢 、 效 率 低 。 


奸 攻 器 变 沿 科 | 册 口 小 


后. 
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, 详 十 尖 将 证 字 清 交 洛 


“是 岂 哨 注 - 
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离线 存储 的 典型 产品 是 磁带 库 ， 价 格 相对 低廉 。 

近 线 存储 主要 定位 于 客户 在 线 存储 和 离线 存储 之 间 的 应 用 。 指 将 那些 
并 不 是 经 常用 到 ， 或 者 说 数据 的 访问 量 并 不 大 的 数据 存放 在 性 能 较 低 的 存 
储 设备 上 。 但 同时 对 这 些 的 设备 要 求 是 寻 址 迅速 、 传 输 率 高 〈 例 如 对 客户 
一 些 长 期 保存 的 不 常用 的 文件 的 归档 ) 。 因 此 ， 相 对 来 说 近 线 存 储 对 性 能 
要 求 并 不 高 ， 但 要 求 相 对 较 好 的 访问 性 能 。 同 时 ， 多 数 情况 下 由 于 不 常用 
的 数据 要 占 总 数据 量 的 比较 大 的 比重 ， 这 也 就 要 求 近 线 存储 设备 需要 容量 
相对 较 大 。 

数据 分 为 热 数据 、 温 数据 和 冷 数 据 。 热 数据 是 指 在 事务 处 理 系 统 中 被 
频繁 访问 的 数据 ， 一 般 存储 在 快速 存储 器 中 。 温 数据 被 访问 频率 相对 较 低 ， 
一 般 存储 在 相对 较 慢 的 存储 器 中 。 冷 数据 指 极 少 被 访问 的 数据 ， 会 被 存储 
在 企业 最 慢 的 存储 器 中 。 

被 备份 的 数据 都 是 冷 数据 。 随 着 计算 机 技术 的 发 展 ， 用 于 数据 备份 的 
存储 器 出 现 过 各 种 各 样 的 格式 。 最 初 在 IBM 的 PC 上 用 软盘 备份 ， 容 量 
为 360KB， 之 后 达到 1.2MB。 一 些 大 中 型 计算 机 采用 磁带 备份 。 后 来 出 现 
了 650MB 的 光盘 ， 以 及 容量 为 4GB 的 DVD 光盘。 目前 的 存储 设备 主要 
有 器 盘 及 外 接 硬盘 ， 也 出 现 过 刻录 光盘 ， 不 过 现在 已 经 很 少 使 用 了 。 以 上 
存储 设备 可 以 理解 为 个 人 存储 ， 特 点 为 数据 量 小 ， 数 据 分 割 存储 ， 适 合 数 
据 量 比较 小 的 情况 ， 但 作为 大 数据 来 源 的 许多 数据 源 可 能 就 保存 在 这 些 设 
备 上 。 

如 今 又 出 现 了 云 存储 ， 即 处 于 热 备份 或 者 是 温 备 份 的 状态 ， 可 以 随时 
使 用 。 当 然 云 存储 和 数据 的 分 布 式 存储 还 有 很 多 问题 需要 解决 ， 毕 竟 我 们 
现在 对 数据 的 要 求 还 处 于 一 种 温 备 份 的 状态 ， 而 且 它 分 布 在 不 同 的 机 器 上 ， 
数据 来 源 不 同 且 放 在 一 起 也 有 危险 。 分 布 式 的 存储 目标 以 云 中 心 为 基础 开 
发 关于 数据 存储 和 数据 查询 的 一 些 功能 ， 并 且 形 成 分 布 式 的 存储 管理 方案 ， 
也 就 是 说 它 是 基于 “ 云 ” 但 是 不 止 一 个 “ 云 ”。 这 样 , 数据 可 以 进行 同时 查询 。 
有 了 “ 云 ” 作 为 数据 存储 的 目标 ， 以 前 个 体 存储 的 方式 都 会 被 淘汰 。 

大 数据 的 工作 之 一 ， 就 是 把 分 散 的 数据 综合 在 一 起 。 把 冷 数据 变 成 热 
数据 ， 把 离线 存储 变 为 在 线 存 储 。 


2.1.3 非 结构 化 数据 


数据 一 般 分 成 结构 化 数据 和 非 结构 化 数据 。 现 在 大 家 比较 关注 的 非 结 
构 化 数据 ， 比 如 ， 视 频 、 图 像 、 声 音 ， 实 际 上 应 该 归 为 多 媒体 数据 ， 标 准 
的 非 结构 化 数据 应 该 是 不 能 通过 普通 关系 数据 库存 取 的 文本 数据 ， 比 如 ， 
JSON 格式 或 者 XML 格式 数据 。 在 数据 时 代 ， 应 该 以 结构 化 数据 和 标准 的 
非 结构 化 的 数据 为 主 ， 把 非 结 构 化 和 结构 化 数据 一 起 处 理 。 

至 于 视频 、 图 像 和 声音 ， 在 数据 时 代 它 的 作用 不 是 很 大 ， 很 可 能 属于 
下 一 个 时 代 ， 而 不 属于 数据 时 代 。 因 为 必须 有 技术 从 这 些 文档 里 提取 可 以 
保存 的 结构 化 数据 ， 才 可 以 对 它 进行 利用 ， 和 否则 这 种 多 媒体 格式 的 文档 作 
用 不 大 。 虽 然 从 Hadoop 的 应 用 情况 来 看 ， 存 储 多 媒体 数据 成 为 一 个 主要 
目标 ， 但 它 可 能 会 误导 发 展 方向 ， 因 为 多 媒体 数据 虽然 数据 量 很 大 ， 但 含 
金 量 很 小 。 就 像 不 一 定 是 铁 矿 石 就 可 以 炼 铁 ， 钢 铁 厂 会 尽量 采用 含量 高 的 
铁 矿石 。 视 频 、 声 音 和 图 片 的 含金量 目前 来 说 是 非常 有 限 的。 特别 是 视频 ， 
它 占据 的 空间 非常 大 , 但 含金量 比较 小 , 起 码 我 们 还 没有 能 力 发 掘 其 中 的 价值 。 
我 们 的 精力 应 该 主要 放 在 这 种 结构 化 数据 和 不 是 多 媒体 的 非 结构 化 数据 上 。 


2.1.4 数据 处 理 的 三 个 层次 : 产生 、 获 取 和 分 析 


数据 处 理 分 数据 的 产生 、 数 据 的 获取 和 数据 的 分 析 三 个 层次 。 

数据 的 产生 在 信息 技术 革命 完成 的 今天 已 不 成 问题 。 现 在 不 但 存在 大 
量 的 数据 ， 同 时 随 着 物 联 网 技术 和 应 用 的 发 展 ， 已 经 出 现 爆 发 性 增长 ， 面 
临 数据 过 剩 的 问题 。 在 数据 时 代 ， 技 术 开 发 的 重点 不 应 该 在 数据 的 获取 上 ， 
它 应 该 是 信息 技术 发 展 的 必然 结果 ， 而 且 ， 数 据 开 发 得 越 好 ， 数 据 的 产生 
会 越 多 。 虽 然 还 有 很 多 数据 没有 量化 ， 比 如 有 人 在 做 量化 历史 工作 ， 把 历 
史上 存在 的 档案 录入 计算 机 变 成 数据 ， 但 这 只 是 一 些 特定 领域 的 拾遗 补 阅 
工作 ， 不 是 数据 时 代 工 作 的 主流 。 

其 次 是 数据 的 获取 问题 。 由 于 数据 分 布 的 离散 性 和 格式 的 多 样 性 ， 现 
在 并 不 能 很 方便 地 获取 数据 。 比 如 一 个 企业 老板 ， 按 理 来 说 他 是 企业 最 高 
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负责 人 ， 有 权力 获得 企业 的 任意 数据 ， 并 不 存在 安全 和 隐私 问题 ， 也 没有 
资金 的 问题 ， 但 他 仍然 很 难 获取 这 些 数据 ， 一 个 主要 原因 是 数据 分 布 在 不 
同 的 系统 中 。 

信息 化 基础 较 好 的 公司 ， 会 有 很 多 的 信息 系统 ， 而 每 个 信息 系统 都 由 
不 同 的 公司 提供 ， 并 且 放 在 不 同 的 数据 库 系统 中 ， 不 同系 统 的 数据 库 格式 
有 不 同 的 定义 。 理 论 上 ， 公 司 老 板 应 该 能 够 看 见 所 有 数据 ， 但 实际 上 他 并 
不 能 获取 完整 数据 ， 只 能 根据 软件 公司 提供 的 程序 查询 部 分 数据 。 程 序 使 
用 也 不 太 方便 ， 不 同 信息 系统 有 不 同 的 查询 程序 ， 同 一 个 查询 程序 查询 不 
同 数据 要 调用 不 同 功能 。 

放眼 数据 时 代 ， 任 何 一 个 人 应 该 都 能 处 理 分 布 在 全 国 不 同 单位 的 数据 ， 
但 由 于 异 构 的 数据 库 和 不 同 的 服务 器 ， 要 整合 数据 涉及 很 多 复杂 问题 ， 需 
要 从 技术 上 和 法 规 上 进行 研究 ， 开 发 出 一 种 共享 技术 和 机 制 。 由 于 互联 网 
不 提供 结构 性 数据 而 且 对 于 权限 的 控制 比较 薄弱 ， 更 没有 数据 的 整合 ， 原 
来 基于 互联 网 的 存 取 方 式 不 可 套用 。 

最 后 是 数据 的 分 析 问 题 ， 即 如 何 看 懂 数 据 。 基 于 目前 获取 数据 的 困难 ， 
想 要 分 析 数 据 并 得 出 有 用 结果 更 是 难 上 加 难 。 由 于 人 类 能 力 有 限 ， 对 数据 
的 分 析 需 要 把 大 数据 转化 为 人 类 可 以 认 知 的 小 数据 并 可 视 化 。 

综 上 所 述 ， 数 据 时 代 的 应 用 需要 解决 以 上 三 个 层次 问题 ， 其 核心 是 数 
据 的 获取 和 分 析 。 只 有 解决 了 这 三 个 问题 ， 数 据 时 代 才 算 真 正 到 来 。 


2.1.5 数据 比 图 像 、 视 频 更 有 价值 


传统 上 人 类 认识 客观 世界 的 方法 以 “眼见 为 实 ” 按照 信息 技术 的 分 类 ， 
实际 上 是 相信 图 像 和 视频 的 信息 。 但 是 ， 图 像 和 视频 信息 只 能 映射 出 事物 
的 外 表 和 某 个 时 间 点 的 静态 信息 ， 而 无 法 看 到 事物 内 部 的 隐藏 信息 和 时 间 
历史 信息 。 由 于 无 法 获取 事物 过 去 的 图 像 和 信息 ， 仅 靠 “ 眼 见 为 实 ” 来 获 
取 静 态 图 像 和 动态 视频 信息 ， 如 果 没 有 其 他 的 测量 手段 补充 ， 这 样 识 别 事 
物 是 有 局 限 性 的 ， 难 以 掌握 其 本 质 。 

信息 包括 数据 都 是 认识 一 个 事物 的 必要 补充 ， 但 人 们 总 感觉 数据 所 能 


表达 的 信息 很 少 ， 而 图 像 可 以 表达 很 多 。 实 际 上 ， 面 对 描述 很 长 历史 和 众 
多 个 体 的 大 数据 ， 人 类 对 数据 的 认识 是 非常 有 限 的 。 随 着 个 体 的 增多 ， 单 一 
个 体 的 识别 已 失去 价值 ， 对 群体 的 识别 更 为 重要 。 此 外 ， 历 史 数据 也 应 比 单 
一 时 间 点 更 为 重要 ， 但 人 类 对 把 这 两 点 结合 起 来 的 数据 的 应 用 还 远 远 不 够 。 

尽管 现在 人 们 对 图 像 和 视频 的 存储 和 识别 花费 很 大 精力 ， 但 由 于 占据 
存储 空间 很 大 ， 在 硬件 投资 上 占据 很 大 的 预算 ， 从 数据 含金量 的 角度 来 看 ， 
他 们 所 含 的 有 价值 的 信息 非常 少 。 由 于 数据 的 含金量 要 大 于 图 像 和 视频 ， 
因此 ， 技 术 的 重点 应 该 放 在 数据 的 利用 而 不 是 图 像 和 视频 的 利用 上 。 

那么 ， 在 数据 时 代 ， 图 像 和 视频 是 否 就 没有 价值 了 ? 当然 不 是 。 随 着 
识别 技术 的 发 展 ， 将 可 以 从 图 像 和 视频 中 抽取 有 效 信息 ， 转 换 成 数据 格式 ， 
然后 和 其 他 数据 一 起 被 加 以 应 用 。 

换言之 ， 无 论 是 现在 还 是 未 来 ， 数 据 的 利用 才 是 最 大 的 挑战 ， 图 像 和 
视频 最 终 作 为 大 数据 里 面 最 小 粒度 的 数据 ， 只 是 在 从 一 个 很 大 的 数据 集中 
发 现 问题 以 后 ， 需 要 钻 透 至 最 终 的 数据 时 ， 才 会 用 到 图 像 或 者 视频 。 

假设 未 来 能 够 发 明 一 种 癌症 识别 技术 ， 可 以 在 一 个 人 的 照片 中 提取 信 
息 识 别 出 该 人 是 否 是 癌症 患者 ， 那 么 如 何 让 这 项 技术 发 挥 最 大 效益 呢 ? 难 
道 仅仅 靠 医院 提供 癌症 识别 服务 ， 让 病人 拿 照 片 来 逐一 自动 扫描 ， 做 出 诊 
断 吗 ? 显然 ， 通 过 和 大 数据 技术 的 结合 ， 还 有 更 多 价值 可 以 挖掘。 

具体 做 法 是 ， 通 过 收集 大 量 癌症 患者 的 图 像 ， 从 中 抽取 出 每 个 人 的 特 
征 数据 ， 建 立 数 据 库 。 利 用 数据 分 析 ， 找 出 这 些 特征 与 不 同 癌症 种 类 、 发 
展 阶 段 、 治 疗效 果 之 间 的 关联 。 有 了 这 些 关 联 数据 ， 就 容易 找 出 易 患 人 群 的 
特征 , 优先 筛选 的 对 象 .对 不 同 的 治疗 方案 ` 治 疗效 果 和 存活 率 进 行 跟踪 反馈 。 

什么 时 候 需要 用 到 个 体 的 图 像 呢 ? 在 跟踪 具体 患者 对 象 ， 开 始 进行 治 
疗 时 。 所 以 ， 图 像 变 成 数据 钻 取 至 最 后 得 到 的 数据 。 


2.1.6 数据 与 程序 要 分 离 


一 个 独立 的 信息 系统 由 硬件 、 软 件 以 及 数据 库 组 成 ， 计 算 机 软件 是 由 
程序 和 相关 的 文档 组 成 ， 数 据 由 计算 机 软件 产生 ， 保 存在 数据 库 中 。 
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现在 一 个 软件 项 目 ， 一 般 数据 库 和 程序 由 同一 家 公司 开发 ， 软 件 由 该 公司 
交付 ， 以 后 若 由 于 该 公司 的 倒闭 等 原因 不 能 提供 服务 的 话 ， 该 软件 就 会 作废 。 

不 同 于 软件 设计 与 开发 ， 建 筑 设 计 和 施工 是 分 开 来 的 ， 先 有 设计 图 然 
后 施工 。 建 筑 的 设计 师 和 施工 人 员 需 要 完全 不 同 的 专业 技术 ， 由 不 同 的 公 
司 来 负责 。 比 较 而 言 ， 软 件 的 设计 和 开发 混 为 一 体 ， 甚 至 可 由 一 个 人 来 做 ， 
这 种 做 法 显然 不 合理 。 

一 个 比较 合理 的 方式 是 将 软件 的 设计 和 开发 分 开 。 软 件 设计 工作 包括 
数据 库 的 设计 和 程序 界面 的 设计 ， 核 心 是 数据 库 的 设计 。 对 于 软件 的 设计 ， 
需要 丰富 的 经 验 和 对 客户 需求 的 准确 把 握 ， 并 且 留 有 一 定 的 扩展 空间 。 一 
个 不 好 的 设计 不 符合 数据 库 的 设计 原则 ， 设 计 出 来 的 数据 库 缺乏 伸缩 性 ， 
只 能 满足 一 时 的 需求 ， 如 果 需 求 变 动 以 后 ， 修 改 需 要 很 大 工作 量 。 

由 于 是 同一 个 公司 或 个 人 兼 设计 和 开发 ， 不 需要 交流 ， 因 此 很 多 数据 
库 的 设计 缺乏 必要 的 文档 。 如 果 软 件 被 弃 用 ， 数 据 库 的 数据 也 被 废弃 ， 造 
成 数据 的 浪费 ， 影 响 数据 的 后 续 发 掘 利用 。 

理想 做 法 是 ， 首 先 数据 库 应 该 由 经 验 相 对 丰富 的 人 去 设计 ， 然 后 交 给 
经 验 不 是 很 丰富 的 人 去 编程 。 如 果 编 程 的 公司 不 能 维护 ， 由 于 数据 库 文档 
还 在 ,数据库 的 资源 还 能 使 用 ， 可 以 找 另外 一 家 公司 维护 ， 只 要 有 源 代码 ， 
维护 起 来 相对 也 比较 方便 。 即 使 需要 重 编 软件 ， 由 于 数据 库 还 在 ， 和 原来 
的 软件 兼容 性 也 会 比较 好 ， 更 重要 的 是 数据 资源 可 以 得 到 比较 好 的 利用 。 

在 关系 数据 库 发 明之 前 ， 程 序 和 数据 混在 一 起 ， 彼 此 有 很 强 的 依赖 性 。 
但 关系 数据 库 出 现 后 ， 由 于 它 具 有 结构 化 程度 高 、 宛 余 度 低 、 独 立 性 强 等 
优点 ， 从 技术 上 支持 实现 软件 中 程度 和 数据 的 分 离 。 

所 以 在 项 目 开 发 中 ， 程 序 和 数据 应 该 要 分 开 。 这 种 程序 和 数据 分 开 的 
做 法 现在 有 些 地 方 政府 招标 中 已 经 开始 实施 ， 做 法 是 先进 行 数 据 库 的 招标 ， 
再 进行 软件 的 招标 。 


2.1.7 SQL 是 访问 数据 的 通用 语言 


结构 化 数据 是 以 数据 库 或 平面 文件 格式 来 存储 的 ， 可 以 用 二 维 表 的 格 


式 描述 ， 由 行 和 列 组 成 。 一 般 列 数 固定 ， 行 数 可 变 ， 可 能 有 几 万 行 、 几 
十 万 行 数据 。 列 可 以 分 为 文字 格式 、 日 期 格式 、 数 字 格 式 。 一 个 最 简单 的 
二 维 表 可 以 用 文本 格式 来 保存 ， 文 本 格式 一 般 称 为 CSV 文件 。CSV 文件 
每 行 用 换行 符 分 开 来 ， 行 里 面 的 字段 可 以 用 逗号 或 者 制 表 键 分 开 。 在 记 
事 本 等 文本 编辑 器 中 看 ， 每 行 的 长 度 不 一 样 ， 也 不 是 对 齐 的 ， 但 如 果 用 
Excel 程序 打开 的 话 ， 会 发 现 已 经 自动 对 齐 ， 一 格 一 格 的 。CSV 是 最 简单 
的 数据 文件 ， 一 个 文件 里 保存 了 一 张 表 。 在 稍微 复杂 的 Excel 文件 中 ， 一 
个 文件 可 以 通过 不 同 的 工作 表 (Sheet) 保存 多 张 二 维 表 。 

更 常用 的 数据 存储 模式 是 关系 数据 库 。 数 据 库 里 面包 含 很 多 二 维 表 ， 
称 为 数据 表 。 数 据 库 管 理 系统 有 简单 的 Access， 或 者 常用 的 SQL Server， 
它们 都 由 微软 公司 提供 ， 还 有 大 型 企业 用 的 Oracle 数据 库 ， 其 他 还 有 IBM 
的 DB2、SAP 的 Hana 等 。 

一 个 数据 库 系统 中 可 以 包含 多 个 数据 库 ， 一 个 数据 库 又 有 多 个 数据 表 。 
数据 库 不 仅 可 以 存在 一 个 服务 器 上 ， 也 可 以 分 布 在 网 络 中 多 台 服 务 器 上 。 

多 个 服务 器 可 以 通过 网 络 相连 ， 不 同 服务 器 上 可 以 安装 不 同 的 数据 库 
系统 ， 通 过 任何 一 台 连 接 到 该 网 络 的 机 器 可 以 访问 这 些 数据 库 。 就 是 说 ， 
如 果 需 要 ， 用 网 络 中 一 台 机 器 上 的 数据 库 访问 程序 可 以 打开 分 布 在 不 同 的 
服务 器 上 的 数据 库 ， 即 使 服务 器 在 国外 ， 也 只 要 联网 即 可 访问 。 

还 有 些 数据 作为 备份 数据 。 一 般 备份 数据 是 把 数据 保存 在 磁带 上 ， 这 
种 数据 平时 不 好 打开 访问 ， 必 须 把 数据 恢复 到 数据 库 中 才能 看 ， 因 为 它 要 
占 不 少 的 空间 ， 所 以 看 完 以 后 需要 把 数据 删除 ， 以 便 恢复 和 查询 其 他 数据 。 

随 着 数据 越 来 越 多 ， 出 现 了 专门 的 数据 仓库 技术 、 数 据 仓库 服务 器 。 
美国 的 Teradata 公司 专门 做 这 种 数据 仓库 服务 器 。 数 据 仓库 中 的 数据 一 般 
只 增加 ， 不 删除 和 修改 ， 只 用 于 查询 ， 保 证 查询 时 即使 数据 量 很 大 访问 速 
度 也 很 快 。 

面 对 越 来 越 大 的 数据 库 ， 一 种 处 理 方法 是 把 一 部 分 不 用 的 数据 备份 起 
来 ， 比 如 说 三 年 以 前 的 数据 备份 起 来 ， 不 放 数 据 库 里 面 ， 平 时 也 查 不 到 ， 
要 查 必须 临时 恢复 。 第 二 种 处 理 方法 是 不 断 地 扩充 服务 器 ， 原 来 是 一 台数 
据 服务 器 ， 现 在 要 用 3 台 或 者 5 台 甚 至 更 多 。 
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用 扩充 服务 器 的 方式 ， 不 但 要 为 增加 的 服务 器 付费 ， 还 要 为 相应 的 数 
据 库 系 统 软件 付费 。 因 为 这 种 服务 器 是 专用 的 服务 器 ， 软 件 许可 跟 服务 器 
的 数量 有 关 ， 所 以 整个 扩充 一 台 服 务 器 在 软件 和 硬件 上 都 有 较 大 花费 ， 一 
般 只 有 IT 预算 比较 宽裕 的 企业 才 这 样 做 。 

但 是 ， 即 使 愿意 投入 ， 这 种 数据 库 的 扩充 也 有 个 限度 ， 至 于 能 否 有 个 
无 边界 的 扩充 ， 比 如 用 普通 PC 服务 器 ， 用 网 络 把 几 千 台 甚至 几 万 台 服 务 
器 连接 起 来 存储 数据 ， 这 就 是 要 用 大 数据 技术 解决 的 问题 了 。 

有 一 种 叫 Hadoop 的 系统 专门 用 于 解决 这 个 问题 。 它 的 思路 是 只 要 用 
普通 的 计算 机 联网 ， 就 可 以 管理 计算 机 中 的 数据 ， 不 管 你 的 数据 多 大 ， 只 
要 增加 服务 器 数量 就 可 以 。 而 且 系统 可 以 弹性 配置 ， 就 是 说 你 的 数据 满 了 ， 
可 以 增加 一 台 服 务 器 ， 系 统 自动 调整 ， 有 一 台 服 务 器 坏 了 ， 可 以 把 这 台 机 
器 关 掉 ， 它 自己 脱离 系统 ， 存 在 这 台 服 务 器 上 的 数据 自动 重新 分 配 到 其 他 
服务 器 上 。 

Hadoop 中 可 以 保存 任意 格式 文件 ， 比 如 视频 。 数 据 也 是 当 作文 件 来 保 
存 的 ， 而 不 像 数据 库 系统 专门 处 理 数据 。 数 据 一 般 用 最 初 介绍 的 CSV 格式 
保存 ， 然 后 通过 一 种 名 为 Hive 软件 访问 ， 模 仿 数据 库 访问 形式 读 取 数 据 。 
从 外 面 看 起 来 ， 好 像 里 面 存 的 也 是 类 似 数据 库 的 二 维 表 。 

数据 的 检索 有 非常 成 熟 的 语言 , 叫 SQL 语言 , 或 者 叫 结构 化 查询 语言 。 
这 个 语言 已 经 非常 成 熟 ， 通 过 语言 的 组 合 可 以 任意 地 查询 数据 库 中 的 数据 ， 
并 且 不 管 有 什么 要 求 ， 都 可 以 检索 出 来 。SQL 语言 有 标准 ， 也 有 不 同 的 数 
据 库 公司 对 标准 进行 扩充 ， 所 以 它 的 主要 功能 都 是 相同 的 。 只 要 学 会 一 种 
SQL， 不 管 在 什么 数据 库 系 统 上 ， 基 本 上 都 可 以 运行 ， 但 不 同 的 数据 库 系 
统 有 一 些微 妙 的 区 别 ， 比 如 查询 两 个 字段 并 合并 为 一 个 文本 显示 出 来 ， 在 
SQL Server 中 用 “+” 就 可 以 ， 在 Oracle 中 用 两 个 “||” 才 行 。 

现在 很 多 跟 数据 打交道 多 的 单位 都 加 强 了 对 SQL 语言 的 培训 。 我 国 的 
审计 单位 很 多 的 审计 员 都 已 熟悉 掌握 了 SQL 语言 ， 这 样 他 们 就 可 以 脱离 程 
序 对 任何 数据 库 进 行 检索 。 

为 把 存储 在 异地 服务 器 上 不 同 数据 库 系统 中 的 数据 合并 查询 ， 要 建立 
分 布 式 的 数据 仓库 系统 ， 并 且 以 SQL 语言 为 数据 检索 的 基础 。 现 在 在 网 络 


上 检索 文章 ， 每 次 检索 只 能 得 到 一 篇 文章 ， 如 果 想 把 两 篇 文章 合成 一 篇 ， 
可 以 分 别 查询 ， 再 利用 软件 进行 编辑 合并 。 在 分 布 式 数据 仓库 系统 里 面 ， 
近期 目标 可 以 先 实现 对 检索 数据 导出 后 再 进行 合并 处 理 ， 远 期 的 目标 一 定 
可 以 进行 联合 查询 ， 把 处 于 多 个 服务 器 中 的 数据 进行 合并 ， 直 接 输 出 一 个 
数据 集 。 


2.1.8 需要 标准 并 开源 的 数据 库 设 计 


美国 的 软件 产业 比较 发 达 , 而 日 本 相对 来 说 比较 落后 , 核心 原因 是 效率 。 

美国 软件 有 两 种 提供 方式 : 一 种 方式 是 软件 产品 ， 即 开发 的 通用 商业 
软件 ， 这 个 软件 可 以 用 于 不 同 的 单位 ， 软 件 产 品 可 以 直接 销售 或 提供 服务 
(Saas) ; 另 一 种 方式 就 是 开源 软件 ， 当 开发 者 觉得 这 个 软件 不 成 熟 ， 自 
己 无 力 独自 完善 和 推广 时 ， 就 把 源 代码 开源 ， 其 他 人 可 以 在 开源 代码 基础 
上 继续 完善 ， 定 制 开发 自己 的 软件 。 这 两 种 模式 导致 的 结果 是 : 任何 一 个 
软件 工程 师 的 工作 成 果 可 以 得 到 最 大 限度 的 应 用 ， 从 而 提高 了 整个 社会 的 
软件 生产 率 。 

日 本 公司 是 定制 化 开发 ， 软 件 都 是 为 特定 用 户 开发 的 。 一 个 软件 工程 
师 的 工作 成 果 只 能 被 一 个 用 户 内 部 使 用 ， 不 能 为 社会 所 共享 ， 换 一 个 用 户 
就 需要 重新 开发 ， 因 此 日 本 整个 软件 生产 率 就 比较 低 。 

但 现在 美国 的 开源 软件 只 是 源 代码 的 开源 ， 还 没有 涉及 数据 库 的 开源 。 

在 数据 时 代 ， 更 重要 的 是 对 数据 库 资 源 的 开源 和 标准 化 。 从 软件 开发 
角度 看 ， 数 据 库 的 定义 常常 能 决定 软件 开发 的 效率 和 面向 应 用 的 弹性 ， 也 
就 是 说 ， 一 个 客户 的 需求 主要 体现 在 数据 库 的 设计 和 用 户 界面 的 设计 上 ， 而 
这 两 个 方面 常常 是 比较 关联 的 。 数 据 库 怎 么 设计 ， 界 面 常常 必须 与 之 对 应 。 

比如 ， 数 据 库 中 常用 的 主 从 表 的 设计 ， 一 般 有 一 个 主 表 ， 记 录 一 个 订 
单 什么 时 候 下 的 ， 客 户 是 谁 ， 一 个 从 表 记 录 销 售 的 明细 ， 订 单产 品 的 规格 、 
单价 、 总 价 。 如 果 数 据 库 里 定义 了 主 从 表 的 结构 ， 程 序 界面 上 就 要 支持 这 
种 主 从 表 的 结构 。 所 以 软件 开发 中 数据 库 设 计 是 一 个 非常 重要 的 方面 ， 特 
别 是 应 用 软件 开发 。 
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美国 更 多 的 是 从 事 系统 软件 开发 ， 所 以 数据 库 不 是 很 重要 。 但 作为 应 
用 软件 开发 ， 数 据 库 则 非常 重要 。 数 据 库 设计 标准 的 开源 和 数据 库 标准 的 
推荐 是 政府 、 学 术 团 体 可 以 做 的 工作 ， 可 以 组 织 编 一 些 比较 标准 的 通用 软 
件 的 数据 库 作 为 指导 规范 ， 提 供给 软件 公司 ， 软 件 公司 再 根据 需求 进行 扩 
充 。 可 以 开发 一 个 数据 库 的 开源 网 站 ， 首 先 把 不 同行 业 数 据 库 设计 的 定义 
公开 ， 其 次 就 是 进行 推荐 ， 这 样 可 以 大 大 提高 社会 劳动 生产 率 。 

在 某 些 行业 领域 ， 比 如 说 财务 软件 ， 数 据 交换 已 经 有 了 国家 标准 。 

开源 数据 库 设 计 要 求 ， 首 先 满足 功能 要 求 ， 其 次 是 有 共性 ;最 后 是 有 
弹性 。 还 可 以 按 应 用 规模 ， 分 成 小 型 、 中 型 、 大 型 三 个 层次 。 小 型 数据 结 
构 比 较 简 单 ， 大 型 数据 结构 比较 复杂 一 点 。 如 此 通过 知识 的 扩散 ， 能 够 大 
大 提高 社会 软件 开发 的 效率 ， 

有 了 标准 并 开源 的 数据 库 结 构 以 后 ， 在 数据 时 代 ， 对 数据 的 应 用 也 会 
比较 方便 ， 因 为 大 多 数 的 数据 库 定 义 是 基于 开源 结构 ， 数 据 分 析 人 员 不 需 
要 花费 太 多 时 间 就 可 以 弄 懂 数据 的 含义 ， 再 提取 到 数据 仓库 中 。 


2.2 关于 数据 


2.2.1 数据 和 信息 的 区 别 


数据 是 一 种 客观 存在 ， 比 如 指定 时 间 指 定 股票 的 成 交 价格 ， 而 信息 是 
对 数据 的 解读 ， 比 如 该 股票 的 价格 是 高 还 是 低 ， 该 买 进 还 是 卖 出 ， 这 些 信 
息 单 靠 成 交 价格 无 法 判断 ， 与 环境 有 关 ， 需 要 根据 以 前 的 价格 和 对 未 来 预 
测 及 投资 人 的 投资 策略 得 出 。 

信息 是 对 数据 通过 比较 、 分 析 、 判 断 从 而 得 出 的 结论 。 同 一 个 数据 在 
不 同 的 时 间 会 产生 不 同 的 信息 ， 不 同 的 人 分 析 同 一 个 数据 也 会 产生 不 同 的 
信息 ， 不 同 区 域 的 人 对 同一 个 数据 进行 分 析 同 样 会 产生 不 同 的 信息 。 因 此 ， 
信息 和 数据 具有 差异 性 ， 同 样 的 数据 会 因 外 在 环境 和 内 在 因素 的 变化 而 产 


生 不 同 的 信息 ， 而 数据 是 客观 存在 的 原始 素材 ， 不 会 随 着 时 间 的 变迁 和 外 
部 条 件 的 变化 而 改变 。 

再 举 一 个 猪肉 价格 的 例子 说 明 同一 个 数据 产生 的 不 同 信息 。 

商务 部 全 国 农产品 商务 信息 公共 服务 平台 发 布 2016 年 7 月 25 日 南京 
农 副 产品 物流 中 心 猪肉 〈 白 条 猪 ) 价格 为 每 千克 22.4 元 。 如 果 在 2016 年 
3 月 看 这 个 数据 ， 得 到 的 信息 是 猪肉 价格 涨 了 ， 不 能 买 ， 因 为 3 月 的 价格 
是 每 千克 16.48 元 。 如 果 是 被 位 于 常州 的 江苏 凌家塘 农 副 产品 批发 市 场 的 
人 看 到 这 个 数据 ， 得 到 的 信息 是 这 个 价格 比较 低 ， 可 以 买 ， 因 为 这 个 市 场 
当天 的 价格 是 每 千克 26.5 元 。 

目前 很 多 的 书籍 和 文章 给 我 们 传递 的 信息 ， 虽 然 在 目前 有 较 大 价值 ， 
但 随 着 时 间 的 推移 ， 会 逐渐 失去 其 原 有 的 价值 。 由 于 书籍 或 文章 中 没有 保 
存 原 始 数据 ， 后 人 将 难以 判别 信息 的 真 伪 ， 也 不 能 通过 和 新 数据 的 比较 生 
成 新 的 信息 。 

由 此 可 看 出 ， 数 据 时 代 应 该 保存 的 是 数据 而 不 是 信息 。 


2.2.2 数据 含金量 


在 资源 领域 有 含量 的 概念 。 比 如 铁 矿 石 ， 不 同 的 矿山 出 品 的 铁 矿石 的 
含 铁 量 不 一 样 ， 不 同 的 铁 矿石 炼 出 来 的 钢铁 的 出 铁 产 量 也 不 一 样 。 为 什么 
中 国 的 钢铁 厂 现在 都 大 量 进口 巴西 和 澳大利亚 的 铁 矿石 ， 就 是 因为 这 些 地 
区 的 铁 矿 测 出 的 铁 含量 非常 高 。 中 国 的 矿山 开采 出 来 的 铁 矿 含 铁 量 非常 低 ， 
在 可 以 选择 含 铁 量 比 较 高 的 矿石 时 ， 一 般 就 会 弃 用 这 些 含 铁 量 比较 低 的 。 

同样 ， 我 们 获取 的 数据 也 有 含金量 问题 。 如 果 按 照 字 节 去 计算 的 话 ， 
虽然 有 些 数据 量 很 大 , 但 它 的 含金量 比较 低 。 因 此 不 是 数据 越 大 , 价值 越 高 。 
大 数据 的 一 个 主要 特征 就 是 价值 密度 低 。 

在 数据 时 代 ， 不 仅 要 关注 数据 ， 也 要 关注 数据 的 含金量 ， 要 把 更 多 的 
注意 力 投入 到 含金量 比较 高 的 数据 上 ， 而 不 是 在 含金量 比较 低 的 数据 上 不 
断 投资 。 

如 何 区 分 不 同 数据 的 含金量 ? 
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首先 , 要 从 数据 的 格式 上 去 区 分 。 一 般 而 言 , 结构 化 的 数据 含金量 最 高 ， 
声音 、 图 像 、 视 频 等 多 媒体 数据 的 含金量 最 低 ， 非 结构 化 数据 介 于 中 间 。 
实际 上 ， 物 联网 数据 的 含金量 也 比较 低 ， 因 为 大 量 的 数据 都 是 相同 的 ， 它 
的 价值 主要 表现 在 数据 的 变化 上 。 

其 次 , 从 内 容 上 来 划分 。 一 般 交 易 数 据 的 含金量 最 高 , 次 之 为 日 志 数 据 ， 
更 差 的 为 社交 媒体 的 数据 。 

总 而 言 之 ， 从 数据 的 开发 应 用 角度 来 说 ， 应 该 从 含金量 比较 高 的 数据 
入 手 ， 然 后 逐步 涉及 含金量 比较 低 的 数据 。 


2.2.3 用 于 理解 大 数据 的 小 数据 


小 数据 不 是 指数 量 比较 少 的 数据 ， 也 不 是 指 用 于 描述 细节 的 数据 ， 更 
不 是 一 个 大 数据 通过 检索 条 件 过 滤 后 的 部 分 数据 。 

这 里 的 小 数据 与 大 数据 有 密切 的 关联 ， 它 不 是 大 数据 的 一 部 分 ， 而 是 
能 够 描述 大 数据 特征 的 数据 。 

维基 百科 对 小 数据 (Small data) 的 解释 是 : 


小 数据 是 能 为 人 类 理解 的 数量 足够 小 的 数据 。 是 一 种 从 容量 和 格式 上 
都 便于 访问 和 操纵 ， 含 有 用 信息 的 数据 。 

“大 数据 ”这 个 术语 是 关于 机 器 的 , 而 “小 数据 ”是 关于 人 的 。 这 是 说 ， 
可 以 一 眼看 清 或 比如 只 有 五 个 相关 数字 的 就 是 小 数据 。 小 数据 是 我 们 以 前 
认为 的 数据 。 大 约 四 分 之 一 的 人 类 大 脑 参与 视觉 处 理 。 理 解 大 数据 的 唯一 
方法 是 将 数据 变 成 小 的 、 视 觉 上 有 吸引 力 的 对 象 ， 这 个 对 象 能 够 表达 大 数 
据 集 的 不 同方 面 或 具有 被 人 类 理解 的 “特征 ”( 如 直方 图 描述 数据 预测 和 
关系 、 图 表 、 散 点 图 ) 。 所 以 有 时 大 数据 被 简化 得 像 小 数据 。 


2.2.4 广义 和 狭义 大 数据 技术 


虽然 大 数据 的 概念 很 火 , 但 实际 上 对 大 数据 技术 的 定义 还 是 有 些 歧 义 的 。 


大 数据 技术 可 分 为 狭义 大 数据 技术 和 广义 大 数据 技术 。 

所 谓 的 广义 大 数据 技术 就 是 包括 BI 在 内 的 传统 的 决策 支持 系统 以 及 
为 实现 决策 支持 系统 开发 的 一 些 商 业 智能 工具 ， 包 括 报 表 工 具 等 。 在 涂 子 
沛 的 《大 数据 革命 》 一 书 中 ， 有 一 章 专门 讲 到 的 大 数据 技术 实际 上 就 是 商 
业 智 能 技术 。 

从 硅谷 的 技术 人 员 的 角度 来 看 ， 大 数据 技术 主要 是 指 以 Hadoop 为 主 
的 一 批 开源 的 数据 工具 ， 而 不 包括 传统 的 商业 智能 技术 。 这 可 以 从 开源 软 
件 中 的 菜单 设置 看 出 来 。 在 商业 智能 软件 中 ， 有 一 类 工具 软件 称 为 ETL 软 
件 ，Kettle 是 一 个 开源 的 ETL 软件 ， 使 用 的 人 很 多 。 若 是 从 广义 大 数据 
角度 来 说 ，ETL 工具 本 身 就 是 大 数据 工具 的 一 部 分 ， 但 实际 上 ， 它 的 菜 
单 中 有 一 组 功能 ， 挂 在 Big Data 的 菜单 下 ， 都 是 针对 Hadoop、HBase 等 
开源 软件 的 控件 。 即 从 Kettle 的 开发 者 的 角度 看 ， 只 有 这 些 开 源 的 软件 才 
属于 大 数据 技术 ， 而 Kettle 软件 本 身 不 属于 大 数据 技术 。 因 此 ， 可 以 把 以 
Hadoop 为 主 的 软件 称 为 狭义 大 数据 技术 。 

从 实际 的 技术 发 展 来 看 ， 狭 义 大 数据 技术 正 是 在 商业 智能 技术 处 于 发 
展 停滞 阶段 以 后 推出 来 的 一 些 新 技术 ， 他 们 的 目标 是 一 致 的 ， 应 该 也 可 以 
融合 。 比 如 Hadoop 的 出 现实 际 上 就 解决 了 大 数据 原来 用 传统 的 数据 仓库 
技术 需要 很 大 投资 才能 解决 的 问题 。 

随 着 狭义 大 数据 技术 的 发 展 ， 出 现 了 和 BI 技术 结合 的 需求 ， 比 如 
eBay 公司 推出 的 Kylin (鹿角) 开源 系统 ， 就 是 BI 中 的 OLAP 技术 和 
Hadoop 的 结合 。 

OLAP 有 MOLAP、ROLAP 和 HOLAP 之 分 。 一 般 MOLAP 和 数据 
库 是 比较 密切 结合 的 ， 比 如 说 微软 的 SSAS 和 SQL Server 的 结合 ，Oracle 
OLAP Server 和 Oracle 数据 库 紧密 结合 ，Kylin 软件 目标 是 实现 和 Hadoop 
的 结合 。ROLAP 的 技术 并 不 需要 把 具体 的 数据 保存 在 特定 的 数据 库 中 ， 
它 只 提供 了 一 个 访问 接口 ， 这 个 数据 库 完全 可 以 把 数据 存在 Hadoop 中 ， 
通过 Hive 的 接口 来 读 取 ， 这 样 仍然 可 以 用 原来 BI 提供 的 一 些 工具 和 接口 
去 访问 数据 ， 只 不 过 这 些 数据 不 是 存在 原来 BI 典型 的 关系 数据 库 中 ， 而 
是 存在 以 Hadoop 为 核心 的 分 布 式 文件 系统 中 。 
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2.2.5 看 懂 数 据 的 认 知 计算 


很 多 领域 需要 用 到 数据 。 现 在 不 是 没有 数据 ， 而 是 怎么 样 去 利用 数据 。 
IBM 把 认 知 计算 确立 为 转型 后 的 重要 战略 支柱 。“ 认 知 ” 这 个 名 字 笔 者 觉 
得 还 是 非常 适合 的 。 数 据 不 是 有 了 就 行 ， 关 键 是 要 从 数据 中 看 到 东西 ， 要 
把 数据 包含 的 信息 转换 成 能 够 识别 、 能 够 了 解 的 信息 才 有 价值 。 

IBM 定义 的 认 知 计算 指 的 是 要 通过 以 人 的 自然 语言 交流 及 不 断 学 习 ， 
通过 技术 与 多 个 学 术 领 域 的 结合 使 人 们 更 好 地 从 海量 复杂 的 数据 中 获得 更 
多 洞察 ， 从 而 做 出 更 为 精准 的 决策 。 

这 里 讲 的 认 知 不 是 计算 机 的 认 知 ， 而 是 人 类 的 认 知 ， 计 算 机 只 是 帮助 
人 类 认 知 的 工具 。 人 类 无 法 通过 大 数据 认 知 ， 只 能 通过 小 数据 。 大 数据 只 
有 转换 为 小 数据 ， 人 们 才能 理解 ， 才 能 认 知 。 数 据 技术 要 解决 如 何 把 大 数 
据 转换 成 人 能 接收 的 小 数据 。 

IBM 的 认 知 计算 包含 领域 比较 多 ， 把 认 知 计算 讲 得 过 于 神秘 ， 和 自己 
的 优势 技术 结合 得 过 于 密切 ， 把 门槛 提 得 很 高 ， 比 如 说 利用 沃 森 系统 的 自 
然 语 言 的 识别 。 认 知 不 一 定 要 自然 语言 ， 它 的 核心 本 质 是 对 数据 的 认 知 ， 
任何 方式 都 可 以 ， 而 且 也 没有 一 个 非常 具体 的 认 知 路 线 。 虽 然 IBM 的 认 知 
计算 更 多 是 一 种 战略 层面 包装 ， 但 这 种 思路 或 是 提 的 角度 是 完全 正确 的 ， 
也 可 以 消除 现在 物 联 网 或 大 数据 应 用 上 的 一 些 误区 。 


2.2.6 数据 的 冷 态 、 温 态 和 热 态 


借用 冷 数 据 、 热 数据 和 冷 备份 、 热 备份 的 概念 ， 可 以 把 一 个 组 织 内 部 
的 数据 存在 状态 分 为 冷 状态 、 温 状态 和 热 状态 ， 分 别称 为 冷 态 数据 、 温 态 
数据 和 热 态 数据 。 

冷 态 数据 是 指数 据 处 于 不 可 访问 状态 ， 对 应 冷 数据 ， 原 因 可 能 是 离线 、 
不 共享 、 无 文档 等 状态 。 离 线 指数 据 保 存在 软盘 、 光 盘 、U 盘 等 媒介 中 ， 
一 般 不 好 直接 访问 。 不 共享 指数 据 存在 的 计算 机 虽然 处 于 连 线 状 态 ， 但 数 
据 所 在 的 文档 不 可 以 被 其 他 计算 机 访问 ， 比 如 一 个 单位 中 许多 人 都 在 自己 
桌面 计算 机 中 生成 和 保存 Excel 文件 ， 文 件 所 在 目录 和 文件 本 身 没有 设置 共 


享 属性 ， 所 以 不 能 被 其 他 人 访问 。 无 文档 指 虽然 数据 连续 且 共 享 ， 但 缺少 数 
据 库 、 数 据 表 、 数 据 文件 的 目录 、 名 称 及 内 容 说 明 ， 其 他 人 找 不 到 相应 数据 
表 或 文件 , 或 者 找到 了 也 读 不 懂 。 冷 态 数据 对 应 目前 大 多 数组 织 的 数据 现状 。 

温 态 数据 是 指数 据 可 以 被 专业 人 员 访 问 和 利用 ， 对 应 热 数据 或 温 数据 。 
最 简单 的 温 态 数据 将 所 有 数据 文件 放 到 一 个 文件 服务 器 的 共享 目录 中 ， 并 
编制 一 个 文件 目录 。 典 型 的 温 态 数据 由 多 个 关系 型 数据 库 和 共享 的 多 个 平 
面 数据 文件 目录 组 成 ， 每 个 目录 中 包含 许多 Excel 和 CSV 数据 文件 ， 熟 悉 
SQL 语言 的 IT 或 数据 分 析 人 员 可 以 编制 SQL 语言 任意 访问 数据 库 。 高 级 
的 温 态 数 据 是 数据 仓库 ， 比 如 银行 用 Teradata 服务 器 和 金融 服务 逻辑 数据 
模型 (FSLDM) 建立 的 数据 仓库 ， 互 联网 公司 用 Hadoop 集群 建立 的 数据 仓 
库 。 目 前 在 大 数据 应 用 比较 领先 的 公司 中 ， 把 数据 从 冷 态 转换 到 温 态 ， 由 
专门 的 IT 部 门人 员 负 责 。 

热 态 数据 是 指数 据 可 以 被 决策 人 员 和 业务 人 员 利 用 ， 比 如 传统 报表 、 
用 BI 展示 工具 制作 的 仪表 板 (Dashboard) ， 使 用 者 不 需要 使 用 SQL 语言 ， 
不 需要 了 解数 据 库 或 数据 文件 的 位 置 、 结 构 、 内 容 ， 一 般 拥有 以 下 特征 。 

(1) 显示 支持 钻 取 的 统计 数据 〈 如 合计 、 平 均值 ) 。 

(2) 计算 速度 快 ， 保 证 及 时 响应 。 

(3) 所 有 数据 可 视 化 。 可 视 化 不 是 热 态 数据 的 唯一 特征 ， 它 是 建立 
在 数据 聚合 基础 上 ， 需 要 用 到 数据 集 市 和 OLAP 技术 。 

目前 在 大 数据 应 用 比较 领先 的 公司 中 ， 把 数据 从 温 态 转 换 到 热 态 工作 
由 专门 的 数据 分 析 部 门人 员 负 责 。 


2.3 走出 大 数据 应 用 误区 


2. 3. 1 从 个 性 化 需求 到 普遍 服务 


目前 的 大 数据 应 用 中 ， 大 都 要 求 结合 用 户 的 实际 情况 实现 比较 具体 的 
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目标 。 如 果 一 个 企业 希望 使 用 大 数据 ， 它 不 但 希望 你 能 够 提供 数据 、 提 供 
算法 进行 相应 的 开发 ， 最 终 还 要 有 一 个 比较 明确 的 目标 ， 对 企业 的 效益 要 
有 明显 的 提升 。 如 果 这 个 工作 对 企业 效益 没有 直接 提升 ， 它 对 这 个 项 目 就 不 
会 感 兴趣 。 这 种 工作 实际 上 是 要 求 提供 一 种 个 性 化 服务 , 也 就 是 做 定制 开发 。 

在 任何 一 个 产业 的 初期 ， 都 是 被 要 求 提供 一 些 个 性 化 的 服务 。 比 如 在 
铁路 运输 开展 业务 初期 ， 如 果 向 用 户 推荐 铁路 运输 服务 ， 不 考虑 成 本 ， 他 
的 需求 肯定 是 点 对 点 的 服务 ， 即 无 论 是 人 还 是 货物 必须 从 起 点 一 直 运 到 终 
点 。 实 际 上 ， 我 们 现在 的 铁路 服务 只 能 从 火车 站 到 火车 站 ， 也 就 是 说 从 起 
点 到 火车 站 、 从 终点 到 目的 地 这 两 部 分 必须 利用 其 他 交通 工具 来 解决 ， 铁 
路 并 没有 提供 解决 方案 。 

理论 上 ， 铁 路 运输 可 以 提供 两 种 服务 ， 一 种 服务 是 普遍 服务 ， 指 火车 
站 到 火车 站 的 交通 ; 还 有 一 种 是 个 性 化 服务 ， 即 点 对 点 服务 。 不 过 现在 火 
车 没有 提供 点 对 点 服务 ， 飞 机 提供 的 商务 包机 服务 可 以 点 对 点 ， 不 但 把 机 场 
到 机 场 的 交通 解决 了 ， 而 且 从 起 点 到 机 场 、 从 机 场 到 终点 的 服务 也 包含 在 内 ， 但 
是 这 种 服务 收费 较 高 ， 不 是 一 般 人 可 以 接受 的 ， 因 此 这 是 一 种 小 众 的 个 性 化 服 
务 。 为 大 众 提供 的 普遍 服务 都 是 机 场 到 机 场 或 是 火车 站 到 火车 站 的 服务 。 

同样 在 数据 应 用 上 ， 今 天 的 用 户 都 提出 了 个 性 化 服务 ， 从 而 证 明了 数 
据 的 应 用 还 处 于 早期 。 因 此 ， 市 场 更 需要 一 种 普遍 服务 ， 这 种 服务 不 一 定 
能 满足 用 户 的 直接 需求 。 比 如 说 不 可 能 保证 他 有 直接 经 济 效益 ， 但 可 以 改 
进 业 务 流程 的 某 个 重要 环节 。 

所 以 ， 大 数据 的 开发 应 该 走出 个 性 化 服务 的 歧途 ， 更 多 的 应 该 探索 一 
种 普遍 服务 。 普 遍 服务 的 特点 是 只 能 解决 部 分 问题 ， 要 说 服用 户 能 够 接受 
这 种 观点 。 用 户 接受 这 个 观点 应 该 也 不 是 很 困难 ， 毕 竟 这 种 普遍 服务 的 成 
本 肯定 比 个 性 化 服务 要 低 。 


2.3.2 走出 结果 导向 


在 目前 大 数据 的 应 用 中 ， 主 流 的 思路 是 有 方向 数据 挖掘 ， 因 此 有 些 用 
户 过 于 强调 结果 导向 ， 也 就 是 追求 有 一 个 明确 的 目标 ， 并 根据 目标 去 采集 


数据 ， 再 为 这 些 数据 购置 相应 的 硬件 和 软件 ， 或 专门 建 模 分 析 。 从 表面 上 
来 看 这 种 方式 比较 实用 ， 实 际 上 ， 是 缺乏 计划 和 远见 。 

以 市 政 建设 为 例 ， 看 看 结果 导向 会 产生 怎样 的 后 果 。 如 果 我 们 现在 要 
铺设 排污 管道 ， 可 能 需要 挖 公路 。 挖 公路 这 一 工作 的 目标 很 明确 ， 因 为 要 
铺设 排水 管道 。 如 果 下 次 要 埋设 天 然 气管 道 ， 那 么 又 要 挖 公路 。 这 就 是 原 
来 我 们 经 常 说 的 马路 上 要 安装 拉链 的 笑话 。 为 什么 一 开始 不 能 建 一 个 统一 
的 管 廊 ， 然 后 由 各 个 部 门 共享 管道 中 的 空间 呢 ?” 就 因为 没有 市 政 建 设 的 经 
验 ， 不 知道 一 个 城市 最 终 要 铺设 多 少 管道 ， 所 有 没有 预先 做 规划 。 

由 此 可 见 ， 市 政 建设 中 的 结果 导向 实际 上 是 “头痛 医 头 脚 痛 医 脚 ”。 
建 马 路 的 时 候 ， 就 应 该 预先 建 好 地 下 管 廊 ， 这 样 才能 避免 后 面 不 断 地 “ 开 
膛 破 肚 ”。 

虽然 现在 大 数据 分 析 难 以 像 公路 管 廊 的 建设 ， 有 一 个 明确 的 规划 。 具 
体 的 分 析 到 底 能 产生 哪些 结果 ， 现 在 还 不 好 预测 ， 但 起 码 知 道 可 实现 的 目 
标 是 多 样 的 ， 因 此 需要 留 有 扩充 余地 。 所 以 在 大 数据 建设 时 ， 不 是 先 预 设 
它 的 结果 ， 然 后 再 采集 数据 ， 而 是 要 把 可 能 采集 的 数据 都 采集 出 来 。 不 能 
过 于 局 限于 采集 当前 所 需要 的 数据 ， 而 是 要 把 采集 的 范围 放宽 松 一 点 ， 以 
便 不 时 之 需 。 虽 然 数据 的 采集 和 存储 需要 成 本 ， 但 相对 大 数据 的 价值 来 说 这 
种 成 本 非常 有 限 ， 而 且 成 本 会 越 来 越 低 。 数 据 的 历史 价值 有 的 时 候 要 大 于 实 
时 数据 的 价值 ， 所 以 在 以 后 分 析 的 时 候 ， 如 果 找 不 到 历史 数据 ， 损 失 会 更 大 。 

由 于 当初 不 知道 到 底 有 多 少 管道 需要 铺设 ， 如 果 提 出 建设 地 下 管 廊 ， 
大 家 就 会 质疑 建立 地 下 管 廊 的 价值 ， 让 人 怀疑 是 否 过 度 建设 。 同 样 ， 作 为 
大 数据 应 用 ， 前 景 非常 广阔 ， 完 全 应 该 接受 类 似 教训 ， 不 要 一 定 有 明确 的 
结果 ， 因 为 即使 现在 能 预测 出 几 个 结果 ， 也 并 不 等 于 是 全 部 结果 ， 很 可 能 
最 后 它 的 实际 效益 远 远 超过 了 当初 的 预计 。 

假如 在 以 后 某 一 天 ， 大 数据 应 用 成 熟 了 ， 需 要 哪些 数据 ， 每 个 数据 有 
什么 作用 ， 能 产生 什么 价值 就 会 一 清二 楚 ， 就 像 现代 城市 的 地 下 管 廊 里 用 
哪些 管道 基本 上 已 经 固定 ， 很 难 再 突如其来 出 现 一 个 新 的 管道 。 但 是 ， 这 
种 情况 出 现 的 时 候 ， 大 数据 应 用 已 经 成 熟 ， 如 果 你 在 这 个 时 候 才 开始 研究 
大 数据 应 用 ， 说 明 你 在 这 个 行业 中 已 经 落后 了 。 


奸 几 器 糙 洛 节 | 山口 让 


局. 


| 63 





` 动 册 涝 泣 


冰 灯 着 洲 , 济 寸 尖 将 证 仿 满 玖 省 


衬 


64| 


2.3.3 从 有 方向 到 无 方向 


在 大 数据 应 用 早期 ， 都 是 一 些 个 性 化 的 应 用 ， 这 些 应 用 为 了 满足 某 个 
特定 的 目标 ， 称 为 有 方向 的 数据 挖掘 。 但 个 性 化 的 应 用 成 本 比较 高 ， 应 用 
面 比 较 局 限 ， 所 以 希望 寻找 一 个 通用 技术 来 应 用 数据 ， 这 就 引出 无 方向 数 
据 挖掘 的 需求 。 

有 方向 的 数据 挖掘 有 非常 大 的 局 限 性 ， 因 为 数据 挖掘 的 需求 多 种 多 样 ， 
而 每 个 算法 目标 比较 单一 ， 不 能 适应 这 些 多 样 化 的 需求 。 即 使 找到 满足 某 
种 需求 的 算法 ， 也 有 许多 的 参数 需要 调整 ， 对 使 用 者 的 专业 化 水 平 要 求 比 
较 高 。 调 整 参 数 需要 使 用 者 有 一 定 的 业务 知识 ， 既 要 懂 业 务 又 要 懂 技 术 ， 
这 种 人 很 少 ， 所 以 影响 到 数据 挖掘 应 用 的 发 展 。 

如 果 有 一 个 司机 提供 一 种 服务 ， 即 每 天 下 午 六 点 从 上 海 浦东 机 场 到 陆 
家 嘴 ， 只 需要 20 元 ， 而 一 般 打 出 租车 可 能 需要 140 多 元 ， 这 种 服务 有 没 
有 价值 呢 ? 

从 表面 来 看 是 有 价值 的 ， 但 实际 价值 不 大 ， 因 为 它 既 设 定 固定 线路 ， 
又 设 定 了 固定 的 时 点 ， 如 果 你 想 五 点 或 者 七 点 走 ， 又 或 者 不 是 到 陆家嘴 而 
是 到 外 滩 ， 那 么 就 享受 不 了 这 种 服务 。 由 于 恰好 满足 这 个 线路 和 时 点 的 概 
率 太 小 ， 所 以 一 般 人 根本 用 不 到 这 种 服务 。 

这 种 情况 非常 类 似 于 数据 挖掘 ， 或 者 准确 地 称 为 有 方向 的 数据 挖掘。 
因为 有 方向 的 数据 挖掘 是 为 了 解决 某 一 特定 的 问题 ， 从 而 选择 了 特定 的 算 
法 , 并 且 设 定 了 特定 的 参数 , 这 种 问题 如 果 在 工作 中 经 常 碰 到 、 重 复发 生 的 ， 
那 肯 定价 值 很 大 ， 但 如 果 发 生 的 不 是 这 个 问题 或 者 相关 的 参数 发 生变 化 ， 
这 个 模型 可 能 就 不 适用 了 。 即 使 可 以 用 同样 的 模型 ， 但 参数 需要 调整 ， 鉴 
于 调整 参数 需要 经 验 ， 必 须 经 过 一 些 试验 工作 ， 原 来 开发 的 应 用 还 是 不 能 
发 挥 作 用 。 

鉴于 在 实际 情况 中 需求 是 各 种 各 样 的 ， 所 以 针对 某 一 个 特定 的 需求 开 
发 ， 它 的 价值 总 是 有 限 的 ， 就 像 这 种 特定 时 间 、 特 定 线路 的 汽车 服务 一 样 ， 
限制 因素 越 多 ， 它 的 价值 越 小 。 

即使 成 功 地 开发 了 一 个 有 方向 数据 挖掘 的 应 用 或 产品 ， 也 只 能 适合 一 


个 行业 或 一 个 企业 的 特定 需求 。 在 一 个 企业 的 众多 需求 中 ， 也 只 满足 其 中 
一 个 。 要 满足 多 个 行业 、 多 个 企业 的 多 个 需求 , 只 能 是 一 项 不 可 完成 的 任务 。 

现在 可 以 说 ， 按 照 有 方向 数据 挖掘 的 思路 已 经 走 入 死胡同 ， 因 此 许多 
著名 软件 公司 放弃 了 这 方面 的 产品 的 后 续 改 进 。 

在 发 现 有 方向 数据 挖掘 的 缺陷 以 后 ， 提 出 无 方向 数据 挖掘 的 概念 ， 也 
有 人 把 它 称 为 探索 性 数据 挖掘 。 它 的 核心 是 不 需要 设 定 目标 就 可 以 进行 数 
据 挖掘 。 因 为 从 事 技术 开发 的 人 员 不 懂 业 务 ， 即 使 懂 业 务 的 人 也 不 知道 自己 
挖掘 的 目标 是 什么 , 它 需 要 根据 业务 的 变化 和 当时 的 环境 来 确定 挖掘 的 目的 。 

无 方向 数据 挖掘 相对 于 有 方向 数据 挖掘 ， 在 开发 的 时 候 并 没有 一 个 固 
定 的 目标 , 它 可 以 适应 多 种 数据 挖掘 的 需求 。 现 在 比较 流行 的 自助 BI 工具 ， 
实际 上 也 是 实现 类 似 的 概念 ， 但 是 因为 它们 以 可 视 化 为 主 ， 没 有 提供 很 多 
的 算法 ， 所 以 没有 数据 挖掘 的 应 用 层次 深 。 但 是 ， 自 助 分 析 工 具 的 走红 跟 
无 方向 数据 挖掘 的 需求 是 分 不 开 的 。 

原来 的 BI 展示 都 是 由 IT 人 员 开 发 ，IT 人 员 需 要 了 解 业 务 人 员 的 需求 ， 
也 就 是 说 它 要 经 过 调研 、 开 发 、 部 署 、 培 训 整 个 一 套 流程 ， 就 像 传统 的 软 
件 开发 一 样 ， 但 是 这 种 流程 走 下 来 以 后 发 现 业 务 部 门 的 需求 又 变化 了 ， 最 
后 导致 原来 的 开发 不 能 满足 新 需求 而 要 重新 开发 ， 这 个 流程 又 需要 走 一 遍 ， 
所 以 造成 了 BI 项 目的 适应 性 不 强 。 

为 了 解决 这 个 问题 ， 索 性 把 BI 的 展示 工作 交 给 业务 人 员 来 做 ， 由 业 
务 人 员 根据 实际 的 需求 ， 通 过 一 个 简单 直观 的 工具 来 自己 制作 ， 类 似 于 事 
务 处 理 软件 中 的 自 定义 报表 。 这 样 相 对 IT 人 员 来 说 就 更 接近 业务 需求 了 ， 
所 以 这 种 BI 的 自助 分 析 工 具 也 可 算 作 一 种 无 方向 的 数据 挖掘 。Excel 是 最 
常用 的 自助 分 析 工 具 ， 目 前 市 场 比较 推崇 的 是 Tableau。 


2.3.4 自助 分 析 工具 与 自助 分 析 系统 的 区 别 


在 BI 方 面 比 较 流行 自助 分 析 工 具 ， 主 要 是 可 视 化 的 数据 工具 。 通 过 
拖 搜 操作 ， 就 可 以 从 一 个 数据 集中 把 数据 设计 成 各 种 可 视 化 的 图 形 。 
自助 分 析 工 具 提供 给 业务 部 门 使 用 ， 不 像 初期 是 由 IT 部 门 或 外 包公 司 
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开发 好 以 后 再 给 业务 部 门 使 用 ， 所 以 它 称 为 自助 分 析 工具 。 

自助 分 析 工 具 虽 然 使 用 很 直观 ， 培 训 时 间 短 ， 但 它 仍然 需要 业务 人 员 
学 习 使 用 ， 而 且 需 要 在 本 机 上 安装 客户 端 程序 ， 对 如 何 从 数据 源 中 提取 数 
据 有 一 定 的 要 求 ， 可 能 还 需要 IT 部 门 的 人 员 去 协助 。 如 果 数 据 源 来 自 多 个 
信息 系统 ， 或 者 数据 源 来 自 单个 数据 库 的 多 个 表格 ， 或 者 数据 需要 经 过 预 
处 理 ， 这 样 工 作业 务 部 门 的 人 员 是 无 法 搞定 的 。 所 以 说 它 还 只 是 一 种 工具 ， 
作为 业务 人 员 需 要 花 一 些 时 间 来 抽取 数据 和 生成 图 形 。 

从 理论 上 讲 ， 业 务 部 门 工 作 重 点 应 该 是 对 已 制作 成 统计 图 形 的 数据 进 
行 思考 、 分 析 ， 结 合 他 的 业务 经 验 从 数据 中 发 现 问题 ， 并 且 通 过 对 数据 的 
钻 取 或 者 多 条 件 的 筛选 来 发 现 问题 所 在 ， 从 而 及 时 地 解决 问题 。 这 就 需要 
提供 一 个 自助 分 析 系 统 。 

自助 分 析 系 统 是 由 IT 部 门 开 发 好 的 ， 可 以 直接 给 业务 部 门人 员 提供 可 
视 化 图 形 的 一 种 系统 ， 它 不 需要 业务 部 门人 员 抽取 数据 和 制作 图 形 ， 比 自 
助 分 析 工 具 更 为 方便 。 

开发 自助 分 析 系统 最 基本 的 要 求 就 是 实现 无 方向 的 数据 挖掘 。 在 业务 
人 员 使 用 自助 分 析 工 具 时 ， 可 以 根据 自己 的 需求 选择 数据 和 制作 图 形 。 作 
为 自助 分 析 系 统 ， 必 须 把 业务 人 员 可 能 需要 的 数据 全 部 准备 好 ， 统 计 图 形 
全 部 制作 好 ， 也 就 是 说 需要 进行 无 需求 的 开发 ， 提 供 过 度 设计 才能 满足 业 
务 人 员 的 需要 。 

自助 分 析 系 统 可 以 减轻 业务 人 员 数 据 分 析 的 工作 量 ， 数 据 是 由 IT 部 门 
制作 好 的 , 可 以 很 多 的 人 同时 使 用 , 大 大 减少 了 重复 工作 , 提高 了 工作 效率 。 
对 业务 人 员 使 用 自助 分 析 工 具 的 水 平和 熟练 程度 不 再 有 要 求 ， 因 此 ， 自 助 
分 析 系 统 更 适合 组 织 内 部 大 量 数据 分 析 工 作 的 需求 。 

可 以 直观 地 用 餐厅 的 营业 模式 来 说 明 自 助 分 析 工 具 和 自助 分 析 系 统 的 
区 别 。 自 助 分 析 工 具 等 于 一 组 炊具 ， 用 这 些 工 具 的 条 件 必 须 是 自己 设计 或 
者 选择 菜品 , 采购 并 处 理 食材 , 拥有 一 定 毫 饪 技术 , 才能 制作 出 美味 的 菜 看 。 
在 推广 自助 分 析 工 具 时 ， 销 售 人 员 常 常会 展示 由 专业 人 员 利 用 这 些 炊具 就 
制 的 菜肴 ， 让 人 看 得 垂 洗 欲 滴 而 产生 购买 欲望 ， 但 它 不 是 直接 提供 这 些 美 
味 佳 看 而 只 是 卖 “炊具 ”。 


自助 分 析 系 统 更 像 自助 餐 ， 客 户 根本 不 需要 知道 这 道 菜 是 如 何 烧 出 来 
的 ， 用 的 是 什么 炊具 和 佐 料 ， 他 的 任务 就 是 从 这 所 有 的 菜 看 中 选择 可 口 的 
去 吃 就 可 以 了 。 如 果 觉 得 有 些 菜 不 想 吃 ， 可 以 不 管 它 。 这 就 是 过 度 设计 。 


2.4 信息 系统 总 体 规划 


2.4. 1 基于 数据 的 规划 


一 个 组 织 的 信息 化 总 体 规划 非常 重要 ， 但 现在 大 部 分 的 规划 由 很 多 的 
独立 子 系统 组 成 ， 子 系统 之 间 没 有 通过 数据 很 紧密 地 关联 在 一 起 ， 就 像 人 
体 只 有 分 离 躯干 和 肢体 ， 没 有 神经 信号 交换 。 虽 然 有 些 总 体 规 划 把 最 高 层 
注 明 为 商业 智能 或 者 决策 支持 系统 ， 但 如 何 实现 这 些 系统 ， 还 没有 具体 的 
方案 ， 仅 仅 只 是 作为 一 个 未 来 的 目标 。 

在 规划 中 首先 要 保证 数据 在 整个 系统 中 的 畅通 ， 明 确 不 同 子 系统 中 数据 
之 间 的 关系 ， 而 不 是 把 不 同系 统 的 数据 孤立 起 来 ， 或 者 根本 就 不 考虑 数据 。 

虽然 从 技术 上 说 ， 这 些 数 据 可 以 放 到 数据 仓库 里 ， 但 数据 仓库 只 是 一 
个 存储 的 地 方 ， 目 的 是 让 数据 能 在 组 织 内 部 共享 ， 并 且 为 组 织 的 决策 所 利 
用 ， 达 到 数据 能 够 被 最 高 层 所 认 知 并 辅助 决策 的 目的 。 

现在 的 信息 化 建设 都 是 在 做 一 些 基础 性 的 工作 ， 主 要 是 建设 不 同 的 子 
系统 ， 用 各 个 子 系统 采集 数据 ， 并 且 希 望 通过 主 数据 的 管理 让 数据 统一 ， 
最 终 才 会 做 到 决策 支持 系统 ， 即 把 决策 支持 系统 当 作 信息 化 建设 的 最 终 目 
标 。 这 种 由 下 而 上 的 信息 化 推进 模式 缺陷 在 于 总 体 目标 的 缺失 ， 并 不 能 用 这 
个 规划 来 凝聚 组 织 内 各 个 部 门 的 共识 , 无 法 团结 大 家 来 共同 完成 规划 的 目标 。 

一 个 好 的 规划 应 该 有 一 个 明确 的 战略 目标 ， 能 够 凝聚 各 方面 的 力量 来 
共同 完成 。 但 是 ， 如 果 规 划 只 在 纸 上 ， 只 是 信息 部 门 的 计划 而 不 是 一 个 组 
织 整 体 的 信息 化 计划 ， 它 涉及 的 只 是 IT 部 门 的 人 ,信息 系统 将 难以 体现 其 
价值 。 如 果 一 个 组 织 的 领导 层 和 除 IT 部 门 以 外 的 其 他 部 门 看 不 到 与 自己 日 





对 树 串 泛 沾 芝 | 需 吕 溃 





167 








68 | 


常 工作 的 关系 ， 信 息 系 统 的 实施 则 难以 得 到 其 他 部 门 的 支持 和 配合 。 

作为 一 个 组 织 的 信息 规划 ， 应 该 让 所 有 部 门 的 人 看 得 懂 ， 起 码 要 都 能 
说 得 清楚 这 个 信息 系统 实现 以 后 会 有 怎样 的 效果 、 对 目前 的 工作 有 什么 样 
的 改进 、 每 一 年 工作 完成 以 后 会 看 到 怎样 的 阶段 性 成 果 ， 即 是 要 变 成 整个 
组 织 的 信息 化 规划 。 

因此 ， 整 个 组 织 的 信息 化 规划 应 该 从 上 而 下 ， 就 是 从 公司 高 层 对 数据 
的 需求 出 发 ， 并 且 把 数据 需求 分 解 到 不 同 的 职能 部 门 ， 让 他 们 认识 到 数据 
的 重要 性 ， 然 后 会 发 现在 现 有 的 信息 系统 架构 下 这 种 需求 是 不 能 满足 的 。 
信息 部 门 的 工作 就 是 弥补 这 样 的 缺陷 ， 这 样 就 把 信息 系统 的 建设 和 业务 部 
门 的 日 常 工作 联系 起 来 。 

比如 说 一 个 销售 部 门 在 日 常 工作 中 需要 100 个 数据 ， 按 信息 系统 的 现 
状 可 能 只 能 提供 50 个 数据 ， 根 据 规 划 每 年 能 增加 10 个 数据 ， 这 样 的 话 IT 
部 门 工 作 和 业务 部 门 就 结合 起 来 了 。 

总 体 规划 的 重点 就 是 从 公司 高 层 决策 支持 者 的 需求 出 发 ， 分 解 到 部 门 
的 决策 支持 , 然后 落实 到 具体 的 信息 子 系统 。 也 就 是 说 , 上 什么 样 的 子 系统 ， 
并 不 是 供应 商 有 什么 样 的 系统 就 上 什么 系统 ， 或 者 其 他 公司 上 什么 系统 就 
上 什么 系统 ， 而 是 需要 根据 业务 部 门 对 数据 的 需求 来 确定 。 规 划 不 是 以 子 
系统 为 核心 ， 而 是 以 数据 为 核心 ， 从 数据 的 需求 出 发 ， 到 能 够 提供 数据 的 
信息 子 系统 的 开发 、 部 署 。 

在 总 体 规划 中 ， 一 个 制造 型 企业 ， 数 据 可 以 分 为 四 个 层次 :第 一 个 层 
次 是 财务 数据 层次 ， 核 心 是 财务 软件 ， 第 二 个 层次 叫 经 营 数据 层级 ， 核 心 
是 ERP 软件 ， 第 三 个 层次 是 生产 数据 层次 ， 核 心 是 MES 系统 ， 第 四 个 是 
控制 数据 层次 , 核心 是 工业 控制 、 物 联网 。 这 个 数据 的 汇总 程度 是 从 高 到 低 ， 
财务 汇总 的 最 高 ， 控 制 数据 层次 最 低 ， 其 他 一 些 系统 都 是 围绕 数据 的 需求 
逐渐 来 弥补 它们 的 不 足 。 

规划 不 仅仅 是 在 纸 面 上 可 以 多 个 子 系统 组 合 在 一 起 ， 相 互 之 间 有 上 下 
级 的 关系 ， 有 线条 关联 ， 最 核心 的 是 这 些 子 系统 之 间 的 数据 可 以 相通 ， 数 
据 可 以 逐 级 汇总 。 数 据 可 以 从 上 到 下 查询 或 分 析 , 可 以 向 下 钻 取 , 由 粗 到 细 。 
达到 这 样 一 个 过 程 的 规划 才能 称 为 一 个 完善 的 信息 系统 总 体 规划 。 


2.4.2 用 规划 展示 数据 不 足 


在 做 信息 系统 规划 时 ， 用 数据 作为 一 个 联络 不 同 子 系统 的 神经 信和 号， 
可 以 从 总 体 上 连接 不 同 的 信息 系统 ， 形 成 一 个 统一 的 整体 。 为 了 让 规划 被 
组 织 的 其 他 部 门 和 领导 直观 认识 ， 可 以 仿造 在 城市 规划 中 搭建 模型 的 方法 。 

在 城市 规划 中 ， 会 建 一 个 三 维 的 模型 ， 然 后 把 规划 中 哪里 会 建 商场 或 
写字 楼 、 哪 里 会 建 居民 小 区 等 用 三 维 模型 显示 出 来 ， 这 样 可 以 给 参观 者 展 
示 出 未 来 城市 建设 的 美好 前 景 。 

在 信息 系统 规划 中 ， 可 以 把 信息 系统 建 完 以 后 得 到 的 各 种 数据 指标 展 
示 出 来 ， 做 成 仪表 板 的 形式 。 数 据 可 以 模拟 。 在 仪表 板 中 有 些 数值 不 能 动 ， 
比如 说 一 直 是 “0”， 就 像 在 规划 模型 中 很 多 楼 是 假 的 一 样 ， 但 有 些 已 经 
可 取得 的 数据 就 可 以 正确 地 显示 处 理 。 这 样 ， 就 知道 信息 系统 哪些 是 已 经 
完成 ， 哪 些 地方 还 有 待 完 成 ， 在 以 后 需要 上 新 系统 的 时 候 ， 就 能 够 马上 明 
白 这 个 系统 对 完善 仪表 盘 具 体 有 哪些 作用 ， 可 以 为 哪些 指标 提供 数据 ， 这 
些 指标 对 经 营 管理 是 否 重 要 。 

大 家 知道 既然 是 规划 ， 那 么 肯定 要 超前 。 很 多 人 认为 自己 单位 做 数据 
分 析 的 时 机 不 成 熟 是 ， 原 因 是 没有 数据 ， 这 种 说 法 放 到 城市 规划 中 就 是 楼 
没有 建 好 ， 所 以 无 法 规划 ， 也 就 否定 了 规划 超前 的 作用 。 规 划 的 时 候 没 有 
形象 的 展示 ， 就 像 城市 规划 没有 模型 不 容易 被 别人 理解 一 样 ， 会 变 成 信息 
部 门 内 部 的 一 种 自 娱 自 乐 。 

在 信息 系统 规划 中 ， 展 示 数 据 的 不 足 不 是 一 个 缺点 ， 而 是 一 个 优点 。 
首先 展示 的 整体 目标 能 让 人 看 到 未 来 ， 展 示 现 在 的 不 足 证 明了 信息 系统 的 
工作 的 重要 性 ， 证 明 信 息 部 门 还 有 很 多 的 工作 需要 做 。 


2.4.3 以 市 长 为 核心 的 智 营 城 市 总 体 规划 


在 智慧 城市 建设 中 ， 整 体 规划 非常 重要 。 许 多 城市 在 建设 智慧 城市 的 
时 候 ， 也 邀请 了 咨询 公司 来 做 总 体 规划 ， 但 这 些 总 体 规 划 没 有 以 数据 为 纽 
带 把 子 系统 统一 起 来 ， 没 有 把 作为 城市 决策 者 一 -市 长 的 需求 作为 整体 规 


示 芋 沸 举 否 顽 | 需 溃 


169 





普 煌 着 洲 “ 济 寸 当 将 证 守 满 亚 汗 
“吉英 消 泛 - 


kt 


70| 


划 的 核心 。 

智慧 城市 的 数据 并 不 是 孤立 的 数据 ， 而 是 相互 关联 的 数据 ， 要 把 数据 
当 作 各 子 系统 之 间 连 接 的 一 个 纽带 。 智 慧 城市 需要 建立 一 个 数据 仓库 ， 把 
所 有 的 数据 都 放 进 去 ， 而 数据 仓库 是 统一 的 。 数 据 仓库 既 可 以 作为 基础 数 
据 库 ， 作 为 多 个 子 系统 共享 数据 的 来 源 ， 也 是 子 系统 运行 的 结果 ， 把 不 同 
子 系统 运行 后 的 结果 汇总 在 一 起 ， 供 市 领导 决策 或 其 他 部 门 共享 。 

建立 数据 仓库 要 把 子 系统 建设 中 的 程序 和 数据 进行 分 离 。 程 序 以 满足 
不 同 的 职能 部 门 的 需求 为 主 ， 但 不 管 它 有 什么 功能 ， 生 成 的 数据 必须 能 够 
抽取 到 数据 仓库 中 ， 要 能 被 其 他 部 门 共享 。 

智慧 城市 中 的 不 同 子 系统 ， 虽 然 用 互联 网 实现 联通 ， 就 像 人 体 一 样 ， 
它 的 神经 网 络 是 通 的， 但 里 面 缺 少 类 似 神经 信号 的 数据 来 传播 ， 所 以 它们 
之 间 并 没有 建立 起 一 个 相互 关联 的 关系 ， 缺 乏 一 个 协同 的 作用 。 

智慧 城市 的 建设 应 该 围绕 市 长 决策 需求 ， 设 计 建 立 一 个 市 长 指挥 室 ， 
以 指挥 室 为 智慧 城市 建设 的 抓 手 有 两 个 好 处 : 第 一 个 好 处 是 让 市 领导 对 智 
慧 城 市 建设 状态 有 一 个 直观 的 了 解 ， 第 二 个 好 处 就 是 智慧 城市 的 建设 能 边 
建设 边 发 挥 作用 ， 并 且 随 着 智慧 城市 的 深入 推进 这 个 作用 会 越 来 越 大 。 

指挥 室 主要 有 哪些 功能 呢 ? 指挥 室 要 按照 智慧 城市 完工 的 格局 来 布 
局 ， 把 整体 架构 先 搭 好， 能 显示 一 个 城市 方方面面 的 数据 。 这 个 架构 中 包 
括 实 时 的 指标 显示 ， 以 及 历史 数据 的 检索 。 指 挥 室 首 先 有 一 个 控制 中 心 ， 
从 每 一 个 领域 中 提取 一 些 重要 的 数据 显示 ， 比 如 说 房产 成 交 量 和 成 交 均 价 
变化 是 地 方 政府 非常 关注 的 指标 ， 也 是 制定 调控 政策 的 重要 依据 ， 因 此 市 
政府 领导 需要 关注 房产 最 新 成 交 量 和 成 交 均 价 ， 及 与 去 年 同期 的 同比 数据 ， 
数据 应 该 每 日 更 新 ， 每 天 可 以 看 到 前 一 天 结束 时 的 数据 。 详 细 分 析 可 以 看 
到 年 初 至 今 的 累计 成 交 量 、 成 交 均 价 ， 本 月 的 成 交 量 、 成 交 均 价 ， 按 时 间 
维度 分 析 每 月 的 成 交 量 、 成 交 均 价 变化 ， 按 空间 维度 分 析 城 市 各 区 的 成 交 
量 、 成 交 均 价 。 

这 种 设计 在 智慧 城市 建设 初期 数据 肯定 是 不 全 的 ， 甚 至 可 能 只 有 小 
部 分 的 数据 。 对 于 一 些 不 能 提交 数据 的 职能 部 门 ， 主 管 领导 会 产生 压力 ， 
他 就 会 努力 督促 下 属 完成 信息 化 建设 工作 ， 并 且 把 数据 送 到 市 长 指挥 室 。 


市 长 在 平时 看 数据 或 开会 的 时 候 ， 就 可 以 明显 地 看 到 哪些 数据 是 新 增 的 
对 下 属 的 工作 起 了 一 个 反馈 和 激励 作用 。 通 过 这 种 不 断 地 反馈 和 督促 就 能 
大 大 推进 智慧 城市 建设 的 步伐 。 市 领导 看 到 这 些 数据 在 他 的 日 常 工作 中 发 
挥 了 作用 ， 他 对 这 项 工作 也 会 越 来 越 支持 。 由 于 对 投入 的 产 出 心里 有 数 ， 
他 支持 的 力度 也 会 越 来 越 大 。 

比如 ， 在 需要 对 房产 市 场 进行 调控 的 关键 时 刻 ， 房 产 管 理 局 及 地 方 税 
务 局 不 能 提供 及 时 的 数据 支持 ， 市 长 不 能 看 到 成 交 量 和 成 交 均 价 的 数据 ， 
并 得 到 分 析 结 果 ， 显 然 他 对 两 个 局 的 工作 会 不 满意 ， 而 政府 的 决策 也 难免 
会 出 现 偏差 。 

目前 的 智慧 城市 建设 主要 从 政绩 观 或 者 上 级 领导 要 求 出 发 ， 主 要 目的 
不 是 利用 智慧 城市 提升 城市 管理 能 力 ， 而 是 通过 智慧 城市 建设 的 需求 来 吸 
引 一 些 相关 的 软件 公司 落户 。 由 于 政府 没有 切实 的 需求 ， 导 致 这 些 落户 的 
企业 工作 没有 目标 ， 最 后 它们 的 工作 的 价值 也 没有 得 到 体现 ， 这 很 不 利于 
整个 软件 产业 的 良性 发 展 。 显 然 产业 的 良性 发 展 就 需要 软件 公司 开发 的 软 
件 能 够 在 市 政 管理 中 产生 实际 作用 ， 从 而 带动 更 多 的 需求 。 对 于 政府 来 说 ， 
通过 提高 效率 、 节 约 投资 等 来 获取 收益 ， 反 过 来 会 督促 软件 企业 开发 出 更 
多 更 好 的 产品 ， 这 样 才能 形成 良性 循环 。 

如 果 一 个 市 领导 在 大 小 会 议 上 宣传 智慧 城市 的 作用 ， 而 实际 上 他 自己 
又 没有 在 工作 中 获 益 ; 他 一 方面 在 开会 的 时 候 宣传 信息 化 的 重要 性 ， 另 一 
方面 他 又 没有 用 任何 的 信息 化 手段 ， 那 么 他 的 下 属 部 门 负责 人 也 不 会 特别 
重视 信息 化 。 目 前 智慧 城市 的 建设 是 政府 通过 行政 措施 推动 的 ， 政 府 制定 
规划 后 由 下 属 职能 部 门 分 别 负责 开发 ， 由 于 开发 的 周期 比较 长 ， 开 发 的 结 
果 又 不 能 及 时 汇总 ， 最 后 到 市 政府 层级 没有 得 到 任何 有 效 的 反馈 ， 这 不 利 
于 整个 任务 的 推进 。 这 种 情况 跟 企 业 信息 化 类 似 ， 老 板 强调 信息 化 的 重要 
性 ， 并 且 要 求 下 面 搞 信息 化 ， 自 己 也 投 钱 ， 最 后 实现 信息 化 的 人 都 是 下 属 
而 非 老板 。 智 慧 城市 最 坏 的 结果 就 是 一 般 公 务 员 都 在 信息 化 ， 而 市 领导 没 
有 。 这 个 问题 出 现 主要 还 是 决策 支持 系统 的 开发 比较 落后 ， 作 为 领导 如 何 
利用 决策 支持 系统 去 工作 还 没有 形成 一 个 标准 的 模式 。 
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推动 数据 间 命 


全 球 范 围 内 ， 运 用 大 数据 推动 
经 济 发 展 、 完 善 社会 治理 、 提 升 政府 
服务 和 监管 能 力 正 成 为 趋势 ， 有 关 发 
达 国 家 相继 制定 实施 大 数据 战略 性 文 
件 ， 大 力 推 动 大 数据 发 展 和 应 用 。 
务 院 《 促 进 大 数据 发 展 行动 
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3.1 数据 的 立法 


要 迎 来 数据 时 代 ， 除 了 技术 上 工作 以 外 ， 还 需要 立法 的 配合 。 

第 一 是 数据 安全 性 的 立法 。 

立法 的 前 提 是 明确 到 底 要 惩罚 什么 ? 是 数据 的 公开 、 数 据 的 传播 、 数 
据 的 应 用 ， 还 是 利用 数据 产生 的 后 果 。 

如 果 把 立法 重点 放 在 数据 的 公开 、 传 播 和 应 用 上 ， 由 于 无 法 把 握 合适 
的 尺度 及 同一 个 行为 可 能 产生 两 个 以 上 的 后 果 ， 导 致 对 合法 行为 的 误伤 ， 
影响 数据 的 利用 。 

所 以 ， 立 法 应 该 把 重点 放 在 数据 不 当 应 用 产生 后 果 的 惩罚 上 。 好 比 不 
能 立法 禁止 菜刀 的 生产 、 买 卖 和 使 用 , 但 如 果 有 人 用 菜刀 杀人 , 那 肯 定 入 刑 。 

第 二 是 立法 的 重点 在 于 数据 强制 性 公开 。 

如 果 一 个 企业 享受 了 政府 给 予 的 垄断 权力 ， 它 就 有 义务 把 财务 数据 和 
经 营 数据 公开 ， 这 与 公司 上 市 需要 定期 发 布 财务 报告 的 道理 一 样 。 立 法 虽 
然 不 能 强制 所 有 的 企业 和 个 人 把 数据 公开 ， 但 它 只 要 有 任何 权利 要 求 ， 都 
必须 公开 相关 经 营 数据 。 

虽然 证 券 市 场 的 建立 是 在 信息 公开 的 基础 上 ， 但 它 每 季度 提供 的 定期 
报告 信息 过 于 粗略 , 无 法 发 现 问题 。 美 国 的 《 萨 班 斯 法 》 就 是 在 “安然 事件 ” 
发 生 以 后 ， 为 了 加 强 了 对 上 市 公司 信息 披露 的 要 求 而 制定 的 。 但 是 ， 这 种 
要 求 增加 了 上 市 公司 的 负担 ， 而 且 这 种 公开 也 不 彻底 ， 所 以 并 没有 真正 解 
决 上 市 公司 信息 公开 的 问题 。 

经 营 数据 的 公开 可 能 会 影响 到 企业 的 商业 秘密 ， 但 是 ， 一 切 用 信息 不 
对 称 建立 的 核心 竞争 优势 都 是 不 合理 的 。 数 据 公开 立法 的 目的 ， 就 是 消除 
所 有 通过 信息 不 对 称 来 获取 利润 的 途径 ， 从 而 使 社会 的 资源 得 到 最 为 合理 


的 配置 。 从 海关 数据 公开 的 多 年 经 验 来 看 ， 进 出 口 数据 的 公开 并 未 影响 相 
关 企业 的 竞争 力 。 

利用 信息 不 对 称 来 获取 利润 的 现象 ， 在 很 多 行业 都 存在 。 比 如 银行 的 
信贷 业务 就 是 利用 了 借款 人 和 贷款 人 信息 不 对 称 ， 现 在 的 P2P 平台 就 是 要 
消除 这 种 信息 不 对 称 。 

第 三 是 数据 作为 起 诉 证 据 的 时 效 。 

如 果 一 个 被 告 将 自己 拥有 的 数据 公开 ， 并 且 数 据 的 产生 时 间 在 一 定时 
间 《〈 比 如 两 年 ) 前 ， 则 任何 人 都 不 能 以 这 些 数据 作为 证 据 控告 他 。 比 如 ， 
一 个 公司 公开 了 两 年 前 单位 工资 数据 ， 有 个 离职 员工 根据 这 些 数据 ， 发 现 
公司 没有 严格 履行 《劳动 法 》， 没 有 为 自己 足 额 缴纳 养老 金 ， 并 据 此 向 法 
院 起 诉 要 求 赔偿 ， 法 院 可 以 拒绝 此 项 证 据 的 有 效 性 。 如 果 企 业 没有 公开 数 
据 ， 或 原告 的 数据 不 是 来 源 于 开放 数据 ， 则 不 适用 此 项 法 律 。 

此 项 立法 有 利于 鼓励 组 织 公开 数据 ， 从 而 推动 社会 的 开放 数据 建设 。 


3.2 数据 的 公开 


3.2.1 对 信息 公开 的 认识 


数据 安全 已 成 为 数据 公开 和 应 用 的 最 大 的 障碍 。 数 据 安全 要 考虑 ， 但 
按照 目前 数据 的 开放 和 利用 的 程度 来 说 ， 考 虑 为 时 尚 早 。 

可 以 比照 食品 安全 问题 去 看 数据 安全 。 现 在 大 家 都 比较 重视 食品 的 安 
全 ， 设 想 一 下 ， 当 遇 到 灾荒 的 时 候 ， 即 食物 供应 严重 不 足 的 时 候 ， 大 家 还 
会 考虑 食品 安全 的 问题 吗 ? 肯定 是 在 食品 比较 富裕 或 者 过 剩 的 情况 下 才 会 
有 这 个 问题 提出 来 。 

如 果 把 数据 比 作 食品 ， 现 在 处 于 饥荒 中 ， 可 用 的 数据 很 少 。 虽 然 确实 
出 现 一 些 数据 泄露 以 及 恶意 利用 数据 的 问题 ， 但 并 不 能 阻挡 信息 公开 ， 就 
像 不 能 因为 发 生 交 通 事故 就 禁止 汽车 一 样 。 
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利用 菜刀 杀人 的 情况 是 永远 存在 的 ， 但 是 ， 不 能 因此 就 在 买卖 菜刀 的 
时 候 先 考虑 菜刀 杀人 的 问题 ， 而 应 先 考虑 菜刀 可 以 切 菜 切 肉 等 生活 问题 。 

对 信息 公开 来 说 ， 这 个 数据 安全 问题 完全 是 过 虑 了 。 

影响 数据 公开 的 另 一 原因 是 数据 公开 的 价值 还 没有 被 人 们 认识 到 ， 否 
则 数据 公开 就 不 会 遭 到 如 此 反对 。 假 设 有 一 个 癌症 病人 ， 需 要 和 他 签订 一 
个 协议 ， 将 他 的 癌症 详细 信息 公开 ， 虽然 现 在 公开 并 不 能 直接 挽救 他 的 生 
命 ， 但 对 后 面 的 病人 ， 医 生 可 以 利用 他 和 其 他 病人 的 病理 数据 进行 研究 ， 
从 而 找到 治愈 的 方法 。 也 就 是 说 ， 如 果 我 们 的 数据 能 够 早点 公开 ， 医 生 能 
够 提前 五 年 得 到 数据 的 话 ， 可 能 就 找到 方案 给 该 病人 治疗 了 。 如 果 让 癌症 
病人 来 选择 ， 也 许 很 多 病人 都 会 来 签订 这 个 协议 ， 同 意 对 数据 进行 公开 。 

同样 的 道理 ， 超 市 想 和 你 签订 一 个 协议 : 假设 你 同意 公开 你 的 购买 信 
息 ， 可 以 降低 商品 5% 的 价格 ， 也 许 很 多 消费 者 也 愿意 签订 这 样 的 协议 。 
实际 上 现在 的 网 上 购物 ， 就 已 经 把 自己 的 信息 在 网 上 完全 公开 。 为 什么 很 
多 人 愿意 ， 其 中 一 个 原因 肯定 是 由 于 网 上 的 价格 比较 便宜 。 

所 以 说 ， 数 据 公开 不 是 一 个 安全 问题 ， 而 是 一 个 利益 问题 。 我 们 只 要 
把 数据 公开 跟 信 息 拥 有 者 沟通 清楚 ， 他 们 并 不 会 反对 信息 公开 。 如 果 现 在 
能 制定 相关 的 法 律 来 限制 对 信息 的 恶意 利用 ， 更 能 消除 大 家 对 信息 公开 后 
产生 的 疑虑 。 


3.2.2 政府 开放 数据 


自 2009 年 美国 总 统 奥 巴 马 签署 了 《开放 透明 政府 备忘录 》 和 数据 门 
户 网 站 Data.Gov 上 线 以 来 , 数据 公开 的 必要 性 已 经 在 西方 国家 达成 了 共识 ， 
世界 各 国 逐 渐 走 上 了 开放 数据 的 道路 。 虽 然 开 放 数据 已 经 体现 按 原始 数据 
公布 和 提供 可 机 读数 据 这 两 个 重要 的 开放 特点 ， 但 是 还 是 遇 到 很 多 难题 。 
第 一 个 难题 是 政府 对 这 些 数据 的 利用 没有 一 个 明确 的 方向 ， 第 二 个 难题 是 
数据 粒度 还 不 够 细 化 ， 影 响 了 数据 的 使 用 价值 。 

由 于 政府 并 未 对 数据 的 用 途 、 使 用 方法 、 处 理 技术 和 所 能 产生 的 价值 
有 一 个 明确 的 意见 ， 所 以 只 是 通过 开放 数据 把 这 些 问 题 提交 给 社会 探索 ， 


并 将 利用 数据 开发 的 软件 在 政府 开放 数据 网 站 进行 推荐 。 数 据 虽 然 得 到 开 
放 ， 但 缺少 数据 应 用 的 成 熟 思路 。 

政府 的 数据 只 是 统计 数据 而 非 原始 数据 ， 比 如 学 校 的 数据 是 按 学 校 统 
计 汇 总 的 数据 ， 而 不 是 基于 学 生 个 体 的 详细 数据 ， 个 体 的 数据 存在 于 学 校 
而 不 是 政府 。 数 据 汇总 后 ， 失 去 了 许多 维度 信息 ， 会 影响 数据 的 利用 价值 。 

我 们 知道 ， 数 据 的 价值 是 通过 支持 决策 产生 的 。 如 果 没 有 决策 行为 或 
者 决策 中 没有 用 到 数据 ， 那 么 这 些 数据 是 没有 产生 效益 的 ， 或 者 决策 中 看 
到 这 些 数据 ， 但 数据 未 能 准确 地 传递 含义 ， 那 么 数据 也 是 没有 产生 效益 的 。 
所 以 ， 仅 靠 现在 的 政府 公开 数据 ， 我 们 还 无 法 发 现 和 实现 其 价值 。 

在 开发 一 个 信息 系统 时 ， 如 果 涉 及 大 量 的 数据 ， 会 有 很 多 成 本 花 在 数 
据 整理 上 。 现在 政府 开发 数据 一 般 按 时 间 用 文本 格式 (如 CSV 格式 ) 提供 
文件 数量 比较 大 ， 软 件 开发 公司 需 花 费时 间 对 数据 做 处 理 ， 这 影响 了 开发 
进度 和 增加 了 开发 成 本 。 

因此 ， 政 府 开 放 数 据 的 下 一 个 目标 ， 首 先 ， 就 是 要 把 分 布 在 不 同文 件 
中 的 数据 整合 到 一 个 分 布 式 数据 库 中 ， 通 过 一 个 入 口 进 入 。 其 次 ， 数 据 可 
以 通过 一 个 比较 常用 的 语言 (如 SQL) ， 或 者 提供 一 个 REST 接口 查询 。 
最 后 ， 是 细 化 数据 ， 比 如 学 校 数 据 要 细 化 到 每 个 学 生 。 明 细 数 据 可 以 不 存 
在 于 政府 ， 可 以 存在 各 个 学 校 里 面 ， 或 者 学 校 通 过 委托 运营 商 放 在 云 服务 
器 中 ， 由 政府 统一 提供 访问 接口 。 


3.2.3 对 开放 数据 的 要 求 


作为 开放 数据 ， 应 该 达到 什么 程度 才能 真正 能 发 挥 作用 ? 

举例 来 说 ， 一 个 城市 里 有 一 个 图 书馆 ， 目 前 一 些 地 方 政 府 的 开放 数据 
网 站 虽然 提供 了 图 书馆 静态 信息 ， 比 如 地 址 、 联 系 电话 、 开 闭 馆 时 间 ， 但 
这 些 种 信息 不 具备 开发 数据 所 需 的 价值 。 

信息 价值 最 基本 的 特征 是 时 效 性 。 简 而 言 之 ， 就 是 数据 记录 里 面 必须 
有 一 个 信息 是 跟 时 间 有 关 的 。 那 么 ， 图 书馆 里 跟 时间 有 关 的 信息 是 什么 样 
的 呢 ? 首 先 可 能 会 想到 图 书馆 一 天 固定 的 开 馆 和 闭 馆 的 时 间 ， 或 者 图 书馆 
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闭 馆 休息 的 日 期 。 但 这 些 数 据 不 是 一 个 动态 的 记录 ， 没 有 特定 日 期 开 闭 馆 
记录 ， 不 具备 时 效 性 ， 只 有 图 书馆 工作 人 员 对 每 天 开 馆 和 闭 馆 时 间 的 记录 
是 有 时 效 性 的 。 

图 书馆 最 重要 的 开放 数据 是 图 书 的 借 还 记录 ， 包 括 借 书 的 时 间 、 借 书 
人 的 信息 、 书 籍 的 信息 、 还 书 的 时 间 。 图 书 借 换 记录 表 记 录 了 主要 数据 ， 
称 为 事实 表 ， 另 外 还 需要 两 张 相 关 表 ， 称 为 维度 表 。 其 中 一 张 维 度 表 是 关 
于 借 书 人 的 信息 ， 包 括 姓名 、 出 生年 月 、 性 别 、 受 教育 程度 等 ， 当 然 为 了 
保密 起 见 可 以 将 姓名 隐藏 。 另 一 个 维度 就 是 书籍 的 信息 , 包括 书 名 、 出 版 社 、 
图 书 分 类 等 。 

这 种 数据 如 果 公 开 ， 对 研究 该 地 区 人 们 阅读 习惯 和 兴趣 点 有 很 大 的 作 
用 。 利 用 这 些 数 据 可 以 分 析 这 些 地 区 人 们 读书 爱好 的 类 型 ， 读 书 的 目的 
当前 社会 上 阅读 的 热点 等 。 证 券 公司 如 果 发 现 一 个 地 区 阅读 股票 类 书籍 的 
人 比较 多 ， 证 明 该 地 区 市 民 对 股票 比较 感 兴趣 ， 就 可 以 多 布局 证 券 营业 网 
点 及 加 大 推广 力度 。 

比较 不 同城 市 的 阅读 倾向 ， 可 以 明显 区 别 不 同城 市 人 们 的 偏好 和 人 文 
情况 。 现 在 有 人 研究 中 国 的 城市 群 得 出 一 些 结论 : 长 三 角 是 中 国 经 济 发 达 、 
文化 修养 比较 高 的 地 方 ， 珠 三 角 经 济 虽然 比较 发 达 但 文化 层次 偏 低 。 这 些 
依据 从 哪里 来 ? 如 果 有 这 些 阅读 的 数据 ， 显 然 就 比较 好 研究 了 。 





3.2.4 政府 主导 的 公共 数据 库 


2016 年 1 月 , 美国 总 统 奥巴马 宣布 发 起 一 项 寻找 癌症 疗法 的 大 型 计划 ， 
用 “ 登 月 计划 ” 作 比 来 说 明 其 重要 性 ， 后 来 又 设立 以 副 总 统 拜 登 为 首 的 “和 白 
宫 抗 癌 登 月 计划 特别 小 组 ”， 目 标 是 让 抗 癌 的 研究 进展 速度 翻 一 番 ， 在 5 
年 内 取得 原本 可 能 要 10 年 取得 的 成 果 。 

美国 副 总 统 拜 登 2016 年 6 月 6 日 宣布 ， 启 用 癌症 “ 登 月 计划 ” 首 个 
大 型 开放 数据 库 ， 则 在 更 好 地 分 享 癌症 相关 数据 ， 帮 助 全 世界 科研 人 员 更 
好 地 认识 癌症 ， 从 而 开发 出 更 有 效 的 疗法 。 美 国 白宫 当天 发 表 一 份 声明 说 ， 
这 个 名 为 “基因 组 数据 共用 ”的 数据 库 将 为 储存 、 分 析 和 分 享 癌症 基因 组 


数据 及 相关 临床 数据 提供 一 个 公共 平台 ， 这 对 推进 精准 医学 、 改 善 癌症 治 
疗 水 平 至 关 重 要 。 

白宫 声明 中 提 到 ， 这 个 数据 库 是 一 个 交互 式 系统 ， 提 供 的 都 是 未 处 理 
过 的 原始 数据 ， 科 研 人 员 可 以 使 用 新 研发 出 的 计算 工具 与 分 析 方 法 重新 分 
析 这 些 数据 。 数 据 库 整 合 了 美国 国家 癌症 研究 所 现 有 多 个 癌症 研究 项 目的 
资料 ， 目 前 已 拥有 1.2 万 名 癌症 患者 的 数据 ， 今 后 全 世界 科研 人 员 可 继续 
向 其 中 添加 更 多 数据 。 

“基因 组 数据 共用 ”数据 库 将 由 芝加哥 大 学 代 美国 国家 癌症 研究 所 管 
理 。 该 数据 库 已 经 具备 数据 时 代 的 一 些 特点 : 

(1) 数 据 库 属于 国家 癌症 研究 所 , 它 是 一 个 公共 事业 , 不 是 私营 企业 行为 ; 

(2) 数据 库 由 芝加哥 大 学 代为 管理 ， 而 芝加哥 大 学 是 一 所 私立 大 学 ， 
即 要 利用 民间 组 织 的 力量 ; 

(3) 数据 库 中 是 原始 数据 ， 而 不 是 经 过 处 理 的 数据 ， 保 证 研究 的 灵活 性 ; 

(4) 数据 库 是 开放 的 ， 全 世界 科研 人 员 都 可 以 添加 数据 ; 

(5) 相对 攻克 癌症 挽救 生命 来 说 ， 患 者 的 隐私 已 不 再 重要 。 


3.2.5 科研 数据 的 公开 


科学 数据 (或 研究 数据 ) 是 指 在 科技 活动 中 (实验 、 观测 、 探 测 、 调查 等 ) 
或 通过 其 他 方式 所 获取 的 反映 客观 世界 的 本 质 、 特 征 、 变 化 规律 等 的 原始 
基本 数据 以 及 根据 不 同 科技 活动 需要 ， 进 行 系统 加 工整 理 的 各 类 数据 集 。 
英国 数字 保存 中 心 ( digital curation centre，DCC) 认为 数据 管理 与 共享 具 
有 多 重 益 处 : 

在 需要 使 用 数据 时 ， 用 户 能 够 找到 并 理解 数据 ; 

@ 当 有 研究 人 员 离 开 团队 ， 或 有 新 研究 人 员 加 入 时 ， 能 够 保持 工作 的 
延续 性 ; 

@ 用 户 可 以 避免 不 必要 的 重复 工作 ， 如 重新 采集 数据 ; 

@ 支 持 文献 的 数据 得 以 保存 ， 从 而 可 对 文献 结论 进行 验证 ; 

@@ 通 过 数据 共享 可 以 开展 更 多 的 合作 ， 推 动 科学 研究 ; 
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@ 能 够 提高 研究 的 显示 度 ; 

@O 其 他 科研 人 员 可 以 引用 数据 ， 使 数据 拥有 者 获得 更 多 荣誉 上 。 

在 开放 获取 (open access) 理念 指导 下 ， 科 研 资助 机 构 积 极 推 动 其 资 
助 的 科研 产 出 的 开放 获取 。 以 往 科研 资助 机 构 主 要 关注 期 刊 论文 、 会 议论 
文 等 正规 出 版 物 的 公开 获取 ， 近 年 来 以 数据 为 中 心 、 数 据 驱 动 科研 的 特征 
越 来 越 突出 ， 为 保证 科学 研究 的 完整 性 ， 科 研 资助 机 构 开始 促进 作为 科研 
产 出 组 成 部 分 的 研究 数据 的 共享 与 开放 获取 ， 并 制定 数据 管理 与 共享 政策 。 
科学 数据 管理 与 共享 政策 的 制定 是 科学 数据 共享 工作 顺利 进行 的 保障 ， 也 
是 推动 科学 数据 管理 与 共享 的 主要 驱动 力 之 一 。 在 科研 资助 机 构 的 数据 管 
理 与 共享 政策 的 要 求 下 ， 研 究 型 图 书馆 及 大 学 图 书馆 开始 为 研究 人 员 制 定 
数据 管理 与 共享 计划 提供 支持 与 服务 。 站 


3.3 ”有 时 数据 隐私 只 是 借口 


数据 的 应 用 现在 刚刚 开始 ， 它 的 前 景 如 何 、 价 值 如 何 ， 社 会 上 还 没有 
形成 一 个 共识 。 

目前 大 家 对 于 数据 的 只 是 隐约 地 认为 它 有 很 大 的 价值 ， 至 于 具体 它 对 
社会 经 济 有 什么 作用 、 如 何 发 挥 作用 ， 社 会 或 者 个 人 愿意 付出 多 少 代价 实 
现 这 个 目标 ， 这 些 问 题 都 是 未 知 。 

如 果 现 在 把 主要 精力 集中 在 数据 的 安全 性 方面 ， 就 像 先 建 起 一 堵 挡 在 
通 向 数据 未 来 的 墙 ， 大 家 都 在 研究 如 何 推倒 这 堵 墙 ， 而 无 暇 关注 这 堵 墙 后 
面 有 什么 。 

任何 人 类 的 探险 活动 都 有 一 个 伟大 的 目标 在 激励 着 。 哥 伦 布 穿 过 大 西 
洋 发 现 新 大 陆 时 ， 没 有 人 知道 他 会 遇 到 多 少 风险 ， 但 他 有 一 个 伟大 的 目标 
就 是 前 往 东方 ， 获 得 东方 的 香料 。 因 为 东方 的 香料 在 西方 具有 很 大 的 价值 ， 
所 以 他 得 到 西班牙 女王 的 支持 ， 获 得 资金 ， 说 服 船员 加 入 他 的 队伍 进行 未 
知 前 程 的 探险 ， 所 以 他 成 功 的 关键 是 有 伟大 的 目标 。 


在 数据 应 用 的 探索 中 ， 我 们 的 目标 现在 还 不 太 明确 ， 就 被 数据 安全 这 
堵 墙 挡 在 路 上 ， 也 许 以 后 想起 来 会 觉得 很 好 笑 ， 因 为 我 们 失去 的 隐私 与 所 
得 到 的 相 比 可 能 是 微不足道 的 。 

现在 ， 我 们 的 主要 任务 应 该 是 描述 数据 应 用 的 未 来 ， 研 究 通过 何 种 途 
径 能 够 产生 最 大 的 价值 ， 给 大 家 描绘 一 个 虽然 失去 部 分 隐私 但 能 拥有 更 多 
的 未 来 。 

当然 , 隐私 需要 保护 , 只 是 相对 于 我 们 的 目标 而 言 , 它 已 经 不 很 重要 了 。 
比如 食品 安全 ， 没 有 人 可 以 说 它 不 重要 ， 不 安全 的 食品 会 造成 生病 、 中 毒 
帮 至 死亡 这 样 的 后 果 ， 但 在 食物 贫乏 的 地 区 和 年 代 ， 饥 饿 的 人 们 会 忽略 食 
品 安全 问题 ， 因 为 身体 的 健康 与 死亡 相 比 是 微不足道 的 ， 所 以 食品 安全 会 
退 居 次 要 层面 。 

同样 ， 在 数据 安全 问题 上 ， 假 设 一 个 人 得 了 癌症 ， 他 的 个 人 信息 和 疾 
病症 状 、 用 药 信 息 ， 本 人 DNA 的 信息 都 是 个 人 隐私 ， 但 如 果 有 人 承诺 ， 
只 要 同意 公开 、 出 售 这 些 信息 就 能 够 治 好 他 的 病 , 那么 估计 没有 病人 会 拒绝 。 

中 国 的 一 家 医药 连锁 集团 代理 一 家 国际 医疗 公司 的 产品 ， 这 个 医药 集 
团 在 国内 约 有 50 亿 元 的 销售 额 ， 它 在 国内 的 销售 渠道 和 销售 对 象 应 该 都 
是 很 有 价值 的 数据 ， 若 是 被 国外 厂商 知道 ， 会 降低 它 的 价值 ， 但 国外 的 厂 
商 又 想 通 过 这 些 数据 研究 产品 去 向 ， 对 产品 下 一 步 研发 起 到 作用 。 开 始 时 ， 
经 销 商 不 愿意 给 出 数据 ， 这 是 典型 的 数据 安全 问题 。 然 后 国外 厂家 提出 条 
件 , 若是 经 销 商 提 供 了 这 些 数 据 , 它 会 返 5% 的 销售 额 。 在 这 种 利益 诱惑 下 ， 
经 销 商 丢 掉 数 据 隐私 担忧 ， 积 极地 开发 数据 信息 系统 为 国外 厂家 提供 数据 。 
这 个 案例 中 表面 是 数据 安全 问题 ,实际 上 是 该 集团 手 上 并 没有 现成 的 数据 ， 
而 采集 这 些 数 据 需 要 花费 不 少 成 本 ， 在 国外 厂家 解决 了 成 本 问题 后 ， 数 据 
隐私 的 障碍 也 就 不 存在 了 。 

所 以 数据 是 有 价值 的 ， 当 价值 得 不 到 体现 的 时 候 ， 常 常 被 人 以 隐私 作 
为 借口 。 但 当 数 据 有 交换 价值 的 时 候 ， 很 多 隐私 问题 就 不 再 存在 。 

在 医疗 改革 中 ， 获 取 病 人 的 治疗 信息 非常 重要 ， 不 论 是 跟 病 人 还 是 和 
医院 洽谈 病人 的 治疗 信息 ， 他 们 都 会 以 隐私 为 借口 拒绝 。 对 于 病人 ， 如 果 
能 够 给 他 们 一 定 的 费用 来 交换 ， 或 者 从 社会 角度 给 配合 交换 隐私 的 人 减免 
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5% 的 医药 费 ， 那 么 很 多 人 会 乐于 提供 信息 。 

现在 很 多 数据 提供 要 求 被 拒绝 ， 关 键 在 于 提供 者 看 不 到 回报 ， 提 供 数 
据 之 后 没有 得 到 直接 的 利益 。 数 据 应 用 的 关键 是 让 数据 相关 者 了 解数 据 应 
用 后 产生 的 价值 ， 并 通过 数据 产生 的 价值 回报 数据 的 提供 者 ， 从 而 形成 良 
性 循环 。 如 此 ， 数 据 产 业 就 会 得 到 理想 的 发 展 ， 而 在 确切 的 回报 没有 得 到 
之 前 ， 能 够 描述 回报 的 前 景 更 为 重要 ， 这 样 才 会 集聚 更 多 的 社会 资源 投入 
到 开发 中 。 

事实 上 ， 更 多 的 时 候 数 据 隐 私 是 一 种 借口 。 按 照 现 在 的 信息 技术 水 平 ， 
提供 一 个 比较 准确 的 数据 需要 做 很 多 的 工作 ， 包 括 数据 相关 软件 的 开发 、 
业务 部 门 的 数据 准确 录入 及 数据 最 终 的 核对 和 定时 提交 ， 无 论 是 额外 支出 
的 费用 还 是 内 部 人 员 的 配合 都 需要 巨大 的 成 本 。 即 使 已 经 有 了 数据 ， 但 这 
些 数据 与 其 他 数据 混合 在 一 起 ， 对 数据 的 分 离 和 单独 传送 也 会 产生 一 笔 额 
外 成 本 。 开 发 一 套 软件 或 者 招聘 专人 去 核对 和 提交 数据 是 较 易 估 算 的 显 性 
成 本 ， 但 业务 人 员 配 合 工作 所 花费 的 时 间 是 隐 性 成 本 ， 一 般 难 以 明确 估计 ， 
所 以 作为 数据 索取 者 应 该 充分 理解 数据 提供 方 所 花费 的 巨额 成 本 。 倘 若 数 
据 提 供 方 觉得 无 利 可 图 ， 是 不 会 投入 成 本 的 。 这 时 ， 他 会 以 隐私 作为 借口 。 

有 一 些 组 织 ， 信 息 化 水 平 比 较 落后 ， 无 法 获取 数据 ， 但 又 不 能 承认 他 
们 没有 能 力 和 数据 ， 他 更 会 以 数据 安全 为 借口 予以 拒绝 。 所 以 针对 数据 安 
全 这 一 问题 ， 应 该 找到 安全 后 面 的 真正 理由 ， 从 而 有 针对 性 地 解决 。 


3.4 数据 基础 设施 


推动 建立 政府 部 门 和 事业 单位 等 公共 机 构 数据 资源 清单 ， 按 照 “ 增 量 
先行 ”的 方式 ， 加 强 对 政府 部 门 数据 的 国家 统筹 管理 ， 加 快 建设 国家 政府 
数据 统一 开放 平台 。 制 订 公 共 机 构 数据 开放 计划 ， 落 实数 据 开放 和 维护 责 
任 ， 推 进 公 共 机 构 数 据 资 源 统一 汇聚 和 集中 向 社会 开放 ， 提 升 政府 数据 开 
放 共 享 标准 化 程度 ,优先 推动 信用 、 交 通 、 医 疗 、 卫 生 、 就业、 社保、 地理 、 


文 人 化、 教育、 科技、 资源、 农业、 环境 、 安 监 、 金 融 、 质 量 、 统 计 、 气 象 、 
海洋 、 企 业 登记 监管 等 民生 保障 服务 相关 领域 的 政府 数据 集 向 社会 开放 。 
建立 政府 和 社会 互动 的 大 数据 采集 形成 机 制 ， 制 定 政府 数据 共享 开放 目录 。 

国务 院 《促进 大 数据 发 展 行动 纲要 》 


3.4.1 数据 作为 基础 设施 


数据 的 采集 、 保 存 和 服务 有 一 定 成 本 ， 而 数据 服务 有 一 定 的 公共 性 ， 
因此 数据 建设 应 作为 一 种 基础 设施 。 公 路 、 港 口 、 铁 路 是 属于 工业 时 代 的 
基础 设施 ， 网 络 和 互联 网 是 属于 信息 时 代 的 基础 设施 ， 那 么 公共 数据 库 则 
可 称 为 数据 时 代 的 基础 设施 。 

基础 数据 的 采集 ， 应 该 成 为 政府 的 一 种 公共 投资 。 数 据 采集 工作 可 以 
委托 给 私营 机 构 来 操作 ， 但 数据 开放 应 该 是 一 种 强制 行为 ， 可 以 通过 国家 
定价 的 方式 来 确定 收费 价格 ， 从 而 给 予 数 据 运营 企业 一 定 的 回报 。 

2016 年 中 国 发 生 一 起 关于 药品 电子 监管 码 〈 以 下 简称 药 监 码 ) 叫 停 事 
件 。 国 家 食品 药品 监督 管理 局 要 求 所 有 企业 推广 药品 电子 监管 码 的 决策 受 
到 了 众多 药品 零售 企业 的 反对 ， 究 其 根源 是 这 些 药品 零售 企业 不 明白 数据 
采集 的 成 本 应 由 谁 承担 ， 最 终 的 数据 如 何 为 公共 事业 服务 。 政 府 通过 行政 
命令 要 求 企业 来 承担 这 方面 的 成 本 。 山 东 某 大 药房 连锁 股份 有 限 公 司 的 董 
事 长 认为 若 要 全 面 实 现 药 监 码 其 760 多 家 门店 合计 一 次 性 需 投 入 1 000 多 
万 元 ， 可 是 投入 之 后 数据 都 为 阿里 健康 公司 所 有 ， 并 且 阿 里 健康 会 对 这 些 
数据 进行 二 次 开发 和 销售 。 显 而 易 见 ， 这 会 产生 利益 不 对 称 的 问题 ， 药 品 
销售 连锁 企业 出 资 提供 数据 而 可 能 被 阿里 健康 拿 去 销售 。 

合理 的 方案 是 ， 首 先 ， 应 规定 数据 为 国家 公共 所 有 ， 仅 由 阿里 健康 负 
责 运营 ， 同 时 阿里 健康 对 数据 的 使 用 定价 必须 公开 ， 而 不 能 以 隐私 为 名 行 
自己 的 盈利 之 道 ， 其 次 ， 应 用 数据 的 定价 应 该 实现 政府 定价 ， 数 据 使 用 企 
业 必 须 承 担 一 部 分 费用 。 

阿里 健康 的 数据 变现 ， 市 场 有 一 个 培育 过 程 ， 短 期 内 的 收入 不 可 能 完 
全 覆盖 整个 数据 的 采集 、 储 存 和 开发 的 成 本 。 这 种 情况 下 ， 需 要 国家 把 它 
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当 作 一 个 基础 设施 来 投资 ， 而 不 能 要 求 所 有 的 投入 都 得 到 短期 的 回报 ， 最 
低 限度 下 ， 应 该 按照 30 年 或 者 50 年 的 运营 期 来 计算 投资 回报 。 

投资 回报 除 市 场 培育 问题 以 外 ， 数 据 的 权威 性 、 开 放 度 不 够 也 有 很 大 
的 影响 。 阿 里 健康 的 数据 提供 的 是 单个 数据 检索 的 结果 ， 或 是 经 处 理 后 的 
统计 数据 ， 不 提供 未 经 处 理 的 原始 数据 。 它 按照 自己 的 理解 和 开发 水 平 来 
提供 数据 ， 而 并 非 抱 着 开放 的 态度 ， 或 不 是 培育 数据 产业 的 目的 同 社会 进 
行 密切 合作 共同 开发 数据 。 由 于 阿里 健康 合作 门槛 高 ， 一 般 企业 难以 与 它 
合作 ， 因 此 对 数据 的 垄断 导致 了 创新 不 足 ， 同 时 又 不 给 社会 创新 的 机 会 ， 
这 就 影响 到 整个 数据 产业 的 健康 发 展 。 


3.4.2 数据 垄断 的 “滑铁卢 ” 


2016 年 的 药品 电子 监管 码 事件 ， 是 阿里 健康 试图 芍 断 数据 资源 ， 遭 到 
药品 流通 行业 抵制 后 遇 到 的 “滑铁卢 ”事件 。 四 

药 监 码 平台 建设 是 数据 社会 数据 基础 设施 建设 的 先行 者 ， 暴 露出 来 的 
问题 也 是 阻碍 数据 共享 平台 建设 的 共性 问题 ， 解 决 这 些 问 题 在 国家 层面 必 
须 先 有 一 个 明确 的 战略 。 下 面 分 析 一 下 出 现 这 些 问 题 的 原因 。 

(1) 政府 监管 部 门 的 不 重视 。 药 品 监管 平台 在 数据 时 代 是 非常 重要 
的 基础 设施 ， 但 政府 部 门 从 开始 到 现在 ， 并 没有 认识 到 它 的 重要 性 ， 也 没 
有 形成 建设 的 思路 和 总 体 的 框架 ， 完 全 放手 让 社会 公司 去 做 ， 自 己 只 有 名 
义 上 的 所 有 权 ， 既 没有 专门 的 部 门 和 人 去 运作 平台 ， 也 没有 对 这 个 平台 后 
续 的 使 用 和 权益 做 明确 的 界定 ， 基 本 是 采用 一 种 “放羊 ”的 方式 。 

(2) 平台 的 建设 由 社会 公司 自 筹资 金 完成 ， 政 府 对 它 也 没有 系统 的 
补贴 ， 更 没有 采取 采购 服务 的 方式 资助 ， 社 会 公司 就 认为 这 个 平台 是 自己 
建 的 ， 所 有 的 数据 也 应 该 都 是 自己 的 。 

(3) 作为 平台 的 建设 公司 阿里 健康 过 于 贪心 ， 想 利用 政府 赋予 的 殉 
断 权 获取 最 大 的 利益 ， 而 且 这 个 利益 的 获取 是 全 方位 的 ， 包 括 数据 采集 过 
程 中 设备 的 采购 、 数 据 传 送 的 接口 、 数 据 的 二 次 开发 和 使 用 ， 所 有 利益 都 
想 通 吃 ， 而 且 是 一 种 排他 性 的 通 吃 ， 完 全 没有 共享 的 理念 ， 把 数据 资源 当 


作 自己 获取 利益 的 一 个 手段 ， 而 不 是 把 数据 资源 作为 一 个 公益 的 资源 ， 然 
后 自己 在 增值 服务 上 获 利 。 

如 果 我 们 重新 复 盘 这 个 事情 ， 正 确 的 应 该 怎样 做 呢 ? 

(1) 政府 主管 部 门 《国家 食 药 监 总 局 ) 应 该 成 立 或 授权 一 个 专门 的 
机 构 ， 主 管 药品 监管 平台 的 建设 。 该 部 门 主要 起 到 一 个 监管 、 协 调 的 作用 ， 
主要 的 目标 是 通过 制定 规则 ， 协 调 各 方面 的 利益 ， 来 保证 数据 的 采集 以 及 
分 享 ， 保 证 对 社会 产生 最 大 的 价值 。 

(2) 在 政府 机 构 下 面 应 该 成 立 一 个 专家 委员 会 ， 对 数据 采集 的 格式 、 
分 享 的 接口 提出 自己 的 技术 标准 ， 平 台 以 后 的 运作 都 要 遵循 这 样 的 标准 ， 
标准 应 该 向 社会 公开 。 

(3) 平台 采取 社会 运作 的 方式 ， 面 向 社会 招标 ， 让 有 能 力 、 有 意愿 
的 公司 运作 这 个 平台 。 一 个 公司 运作 有 一 个 周期 ， 比 如 3 年 或 5 年， 到 期 
以 后 要 重新 招标 。 从 技术 上 ， 专 家 委员 会 应 该 保证 这 个 平台 即使 换 一 家 企 
业 运 作 也 能 平稳 过 渡 ， 关 键 技术 不 会 被 前 一 个 运营 公司 垄断 。 

(4) 平台 的 运作 应 该 完全 由 政府 出 资 ， 除 了 企业 自己 用 的 设备 以 外 ， 
只 要 跟 这 个 平台 有 关 的 专用 设备 都 应 该 由 政府 出 钱 ， 更 不 应 该 向 企业 收取 
平台 的 使 用 费 、 接 口 费 等 。 

(5) 数据 应 该 公开 ， 最 好 是 完全 向 社会 公开 。 如 果 有 顾虑 的 话 ， 也 
可 以 向 审核 合格 的 数据 服务 商 公 开 ， 完 全 可 以 参照 海关 数据 、 证 券 交易 数 
据 的 公开 方法 。 

(6) 要 鼓励 社会 上 的 软件 公司 围绕 这 个 数据 资源 进行 二 次 开发 ， 为 
社会 提供 更 多 的 服务 ， 而 不 要 像 有 些 公司 一 样 自己 垄断 一 个 资源 ， 既 不 向 
社会 开放 ， 自 己 开发 的 东西 又 满足 不 了 市 场 的 需求 。 


3.4.3 公共 数据 服务 与 中 介 
我 们 从 房产 中 介 的 工作 流程 来 分 析 一 下 数据 革命 以 后 的 变化 。 


我 们 知道 ， 房 产 中 介 是 一 种 典型 的 中 介 服 务 ， 需 要 依赖 大 量 的 数据 。 
这 些 数据 包括 房产 的 供应 数据 和 需求 数据 ， 哪 些 人 需要 买房 或 租房 ， 哪 些 
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人 需要 卖房 或 出 租 ， 这 种 数据 是 中 介 业 务 开展 的 基础 。 简 单 来 说 ， 房 产 价 
格 上 涨 的 时 候 掌 握 房 源 数据 很 重要 ， 价 格 下 跌 的 时 候 掌 握 需求 数据 很 重要 。 
毋庸 置疑 ， 数 据 可 以 说 是 房产 中 介 的 核心 竞争 力 ， 房 产 中 介 投 入 了 很 大 的 
人 力 、 物 力 。 

现在 很 多 人 直接 在 网 上 发 布 房地产 供需 信息 ， 但 这 些 房 源 或 需求 信息 
在 网 上 公开 后 ， 打 电话 来 的 不 是 最 终 用 户 而 是 中 介 。 虽 然 信息 发 布 者 希望 
供需 直接 成 交 ， 省 掉 中 介 费 ， 但 实际 上 大 量 房屋 买卖 或 租赁 还 是 在 中 介 撮 
合 下 成 交 的 。 二 手 车 交易 也 有 类 似 现象 。 

因此 ， 我 们 可 以 得 出 以 下 两 点 结论 。 

(1) 房产 需求 和 供应 信息 的 获取 是 很 低 效 的 工作 ， 这 个 需要 第 三 方 
或 者 是 政府 提供 带 有 公共 事业 的 角色 去 服务 。 

(2) 在 供需 信息 公开 的 基础 上 ， 并 没有 降低 房 中 介 的 价值 。 

在 数据 时 代 ， 应 该 把 供需 的 信息 平台 作为 一 个 公共 事业 ， 但 这 个 公共 
事业 的 发 展 并 不 会 降低 中 介 的 作用 。 房 产 交易 的 撮合 并 不 是 有 了 供需 信息 
对 接 就 可 以 轻易 完成 的 ， 还 有 很 多 工作 需要 做 ， 中 介 可 以 提供 很 多 相关 的 
服务 ， 比 如 提供 保证 金 的 担保 、 充 当 签约 的 一 个 中 介 、 协 助 办 理 贷款 和 进 
行 房地产 登记 。 

当然 ， 通 过 公用 信息 的 提供 来 降低 房产 中 介 的 收费 ， 也 是 减少 社会 成 
本 的 方法 。 以 后 ， 中 介 的 工作 要 建立 在 信息 共享 的 基础 上 。 其 实 这 方面 在 
中 国 的 旅游 业 做 得 比较 好 。 旅 游 业 有 组 团 社 和 接 单 社 的 区 别 ， 组 团 社 负责 
组 团 ， 组 团 以 后 会 把 信息 发 布 在 网 上 ， 然 后 所 有 的 旅行 社 都 可 以 接 单 ， 最 
后 都 送 到 一 起 来 ， 这 样 就 能 保证 任何 一 个 组 团 社 能 得 到 更 大 的 客 源 ， 资 源 
因此 得 到 了 整合 。 这 种 整合 实际 上 是 市 场 自由 竞争 的 结果 。 

所 以 ， 在 数据 时 代 ， 应 该 更 多 地 从 数据 的 公共 性 着 手 去 建立 这 个 平台 ， 
从 而 降低 整个 社会 的 成 本 。 


3.4.4 农产品 交易 数据 的 案例 


我 们 以 农产品 交易 国内 市 场 的 建设 为 例 ， 说 明 如 何 利用 信息 技术 和 数 


据 分 析 来 实现 全 国 农产品 市 场 一 体 化 的 建设 。 

数据 一 体 化 市 场 建设 的 核心 是 ， 建 立 农 产品 交易 的 公共 平台 以 及 交 
易 数据 的 共享 。 建 设 主要 包括 三 个 原则 : 一 是 以 社会 运营 为 主 ， 二 是 数 
据 公开 ; 三 是 公开 提供 数据 分 析 结 果 。 

首先 ， 这 个 平台 应 该 由 国家 成 立 专门 的 机 构建 立 ， 并 且 国 家 拥有 平台 
的 所 有 权 和 数据 的 所 有 权 ， 可 以 将 其 定义 为 公共 事业 。 国 家 建立 专家 委员 
会 制定 和 审查 数据 交换 的 标准 。 平 台 的 运作 应 该 由 社会 上 的 公司 来 运作 ， 
采用 政府 购买 服务 的 方式 ， 通 过 竞标 来 委托 社会 公司 开发 运营 。 平 台 的 运 
营 权 可 以 转让 ， 防 止 运营 企业 垄断 。 

其 次 ， 数 据 必须 共享 。 数 据 虽 然 是 这 个 平台 运作 的 ， 但 它 的 所 有 权 归 
国家 ， 只 要 任何 单位 和 个 人 符合 一 定 的 资质 要 求 ， 都 可 以 获取 数据 ， 而 且 
必须 是 最 细 粒 度 的 原始 数据 ， 平 台 的 运营 商 不 得 拒绝 。 

最 后 ， 对 这 些 数据 分 析 的 结果 应 该 公开 传播 ， 特 别 是 通过 新 闻 媒 体 来 
传播 ， 保 证 所 有 的 人 都 可 以 免费 获得 数据 以 及 免费 获得 相关 的 分 析 结 果 。 

对 于 数据 公开 ， 可 以 借鉴 股票 数据 流转 的 方式 。 我 们 知道 ， 全 世界 股 
票 交易 所 的 数据 都 是 公开 ， 有 很 多 的 公司 能 够 提供 股票 数据 服务 ， 可 以 通 
过 时 间 差 来 收费 ， 也 就 是 说 ， 如 果 你 要 实时 接收 数据 肯定 要 收费 ， 如 果 你 
不 需要 实时 ， 只 要 延期 数据 ， 可 以 免费 。 

数据 共享 ， 不 能 仅 提供 简单 的 数据 检索 方式 ， 即 根据 检索 条 件 出 来 几 
笔 明细 数据 记录 ， 这 种 数据 价值 不 大 ， 因 为 这 种 细 粒 度 的 数据 ， 无 法 让 使 
用 者 从 整体 上 把 握 市 场 情 况 。 

一 个 农产品 经 纪 人 会 怎样 利用 数据 呢 ? 他 会 根据 自己 熟悉 的 品种 、 区 
域 ， 在 地 图 上 发 现 同一 种 农产品 价格 的 差异 ， 从 中 赚 取 差价 。 例 如 ， 甘 肃 
省 某 种 农产品 的 交易 价格 为 10 元 钱 ， 同 种 农产品 在 广州 交易 价格 可 能 是 
20 元 。 这 个 数据 不 是 从 单 笔 数据 上 看 出 来 的 ， 而 是 从 成 交 价格 的 平均 值 和 
交易 的 历史 趋势 发 现 的 。 在 发 现 这 个 规律 存在 后 ， 经 纪 人 会 计算 中 间 的 仓 
储 和 运输 的 成 本 ， 发 现 有 利润 ， 就 会 在 甘肃 采购 产品 ， 再 把 产品 运 到 广州 
出 售 ， 实 现 盘 利 。 

如 果 过 多 的 经 纪 人 将 甘肃 的 这 种 农产品 运输 到 广州 来 卖 ， 结 果 不 是 导 
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致 甘肃 农产品 收购 价格 的 上 升 ， 就 是 导致 广州 农产品 销售 价格 的 下 降 ， 从 
而 使 中 间 的 价差 正好 满足 运输 仓储 的 费用 和 适当 利润 的 范围 ， 达 到 一 种 
平衡 。 

如 果 有 这 样 的 平台 ， 农 产品 经 纪 人 就 能 及 时 获取 相应 的 数据 并 对 数据 
研判 ， 全 国 的 农产品 的 价格 就 会 很 快 趋 于 一 致 ， 不 会 出 现 由 于 信息 流通 的 
不 畅 导致 库存 的 积压 和 浪费 。 

为 保证 数据 的 及 时 录入 和 准确 性 ， 可 以 采用 会 员 制 的 方式 ， 收 集 数据 
和 录入 的 数据 是 同一 人 ， 约束 数据 造假 行为 。 男 外 ， 可 以 把 对 农产品 的 补 
贴 和 数据 挂钩 。 为 确保 农产品 数据 的 准确 性 ， 可 以 考虑 卖方 数据 和 买方 数 
据 的 同时 录入 ， 然 后 进行 数据 的 互相 校 验 。 

通过 这 些 数据 ， 可 以 了 解 交 通 运输 费用 对 农产品 交易 的 影响 ， 从 而 采 
取 相 应 的 对 策 。 另 外 对 农产品 的 补贴 也 可 以 有 一 个 明确 的 依据 和 数据 化 的 
标准 。 


3.5 建立 数据 图 书馆 


我 们 知道 的 传统 图 书馆 ， 主 要 以 保存 书籍 为 主 ， 内 容 以 文字 为 主 ， 中 
间 有 插图 。 现 代 图 书馆 也 珍藏 影像 等 多 媒体 资料 。 

在 数据 时 代 ， 会 出 现 与 传统 图 书馆 相似 的 数据 图 书馆 。 数 据 图 书馆 准 
确 地 说 应 该 叫 数据 馆 ， 因 为 只 保存 数据 而 不 保存 图 书 ， 但 为 了 和 现在 的 图 
书馆 有 很 好 的 联系 ， 就 叫 数据 图 书馆 。 

数据 图 书馆 和 数字 图 书馆 有 很 大 的 区 别 。 数 字 图 书馆 本 质 上 和 现在 的 
图 书馆 内 容 上 是 一 致 的 ， 只 不 过 是 把 它 数字 化 了 ， 比 如 说 原来 图 书 是 纸 质 
的 ， 现 在 电子 化 了 。 

那么 数据 图 书馆 呢 ? 首先 它 储存 的 内 容 是 数据 ， 即 阿拉 伯 数 字 以 及 相 
关 的 一 些 说 明 。 数 据 图 书馆 存储 的 范围 远 远 超过 传统 图 书馆 ， 而 且 它 的 数 
据 是 原始 数据 ， 研 究 价 值 更 大 。 数 据 图 书馆 的 原始 数据 与 根据 这 些 数据 撰 


写 的 书籍 不 同 ， 原 始 数据 更 为 精确 。 同 一 个 数据 ， 不 同 的 人 可 以 得 出 不 同 
的 结论 。 数 据 图 书馆 更 像 一 个 数据 素材 馆 。 

数据 图 书馆 保存 的 内 容 ， 是 在 不 同 介质 中 的 数据 。 数 据 图 书馆 第 一 个 
功能 是 读 取 数 据 ， 可 以 提供 多 种 手段 读 取保 存在 不 同 介质 中 的 数据 ， 即 使 
很 老 的 一 个 软盘 ， 也 能 读 取 里 面 的 数据 。 

为 此 ， 除 了 启用 一 些 老 的 计算 机 ， 进 行 维护 后 使 用 外 ， 还 可 以 开发 新 
的 技术 ， 制 造 可 以 读 取 很 多 格式 介质 的 设备 。 就 像 现在 读 卡 器 一 样 ， 同 一 
个 插口 可 以 读 很 多 类 型 的 存储 卡 。 

数据 图 书馆 第 二 个 功能 就 是 对 数据 进行 整理 。 数 据 图 书馆 的 数据 有 两 
种 利用 方法 ， 一 种 是 对 存储 在 原始 介质 中 的 数据 直接 解读 ， 还 有 一 种 就 是 
分 布 式 的 解读 。 

直接 解读 原始 介质 中 的 数据 比较 困难 ， 除 了 读 写 设备 外 ， 其 数据 存储 
格式 ， 元 数据 的 内 容 常 党 未知。 而 且 ， 阅 读者 必须 在 现场 ， 无 法 远程 获取 
数据 。 

应 该 把 所 有 的 数据 整合 到 一 起 去 。 所 以 我 们 要 提供 一 个 分 布 式 数据 存 
储 。 提 出 分 布 式 数据 存储 主要 原因 是 数据 不 应 该 分 散 存 在 不 同 的 介质 上 ， 
特别 是 原始 介质 上 ， 因 为 它 的 容量 很 小 ， 而 且 容易 出 错 。 我 们 应 该 存在 一 
个 云 存储 上 ， 这 个 云 存 储 应 该 是 分 布 在 世界 各 地 的 ， 不 一 定局 限于 本 地 。 
这 种 格式 是 标准 的 ， 可 以 解读 的 ， 可 以 通过 标准 的 SQL 语言 检索 到 分 布 存 
储 在 不 同 云 中 的 数据 。 

关于 数据 图 书馆 中 数据 的 来 源 ， 可 以 通过 各 自 的 捐赠 或 者 购买 来 实现 。 
大 家 觉得 数据 的 安全 性 非常 重要 ， 数 据 拥 有 者 不 会 愿意 提供 数据 ， 实 际 上 
这 里 面 也 分 多 种 情况 。 比 如 说 有 些 数 据 原来 的 所 属 公司 已 经 不 存在 了 ， 它 
的 数据 库 应 该 就 可 以 公开 了 。 还 在 正常 经 营 的 企业 ， 它 的 三 年 或 五 年 前 的 
数据 库 也 可 以 提供 。 

通过 提供 数据 的 备份 托管 服务 ， 可 以 和 数据 提供 者 协商 一 个 保管 和 开 
放 的 时 间 期 限 。 比 如 说 有 些 企业 信息 系统 升级 了 ， 老 系统 数据 是 放 在 老 服 
务 器 中 ， 过 几 年 以 后 ， 服 务 器 中 的 数据 可 能 读 不 出 来 了 。 即 使 数据 可 以 读 
出 来 ， 随 着 人 员 的 流动 ， 过 了 几 年 老 员工 离职 后 ， 这 个 数据 也 无 人 可 识别 。 
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如 果 该 企业 把 数据 捐赠 到 数据 图 书馆 ， 就 有 专业 的 技术 人 员 给 它 保护 、 维 
护 、 解 读 。 当 公司 几 年 以 后 仍然 需要 这 个 数据 ， 还 可 以 得 到 ， 显 然 对 公司 
有 利 。 有 些 数据 做 一 些 经 过 公司 认可 的 处 理 ， 去 掉 客 户 的 名 称 或 者 员工 的 
名 字 等 敏感 性 信息 ， 用 编码 代替 ， 那 么 这 个 数据 就 可 以 立即 公开 。 没 有 去 
掉 的 可 以 在 五 年 至 十 年 后 公开 。 通 过 这 种 和 企业 的 协议 ， 解 决 数据 的 隐私 
问题 。 

关于 数据 的 共享 ， 可 以 采用 对 等 开放 的 原则 。 对 于 共 建 分 布 式 存储 的 
协作 组 织 内 部 ， 数 据 对 等 互相 开放 。 其 他 个 人 和 单位 通过 协作 成 员 访 问 ， 
通过 协作 成 员 对 访问 进行 管理 和 控制 。 

数据 图 书馆 中 数据 使 用 的 一 个 重要 规则 ， 就 是 数据 不 允许 全 集 拷贝 。 
可 以 下 载 其 中 一 部 分 数据 或 汇总 数据 ， 但 不 可 以 原样 复制 。 设 置 这 个 规则 
的 理由 是 : 

(1) 数据 已 经 公开 ， 其 他 人 需要 这 个 数据 发 链接 过 去 就 可 以 了 ， 根 
本 不 需要 下 载 或 复制 ; 

(2) 数据 有 一 致 性 的 问题 ， 复 制 后 数据 有 可 能 被 自 改 ; 

(3) 保证 资料 的 唯一 性 ， 保 护 数据 收集 者 的 权利 。 

下 面 的 一 个 故事 描绘 了 数据 图 书馆 使 用 的 场景 : 


王 素 是 中 部 地 区 一 所 著名 综合 性 大 学 经 济 系 的 研究 生 ， 他 正在 研究 的 
课题 涉及 员工 收入 在 企业 成 本 中 的 占 比 ， 需 要 统计 企业 有 关 经 营 和 工资 的 
微观 数据 。 在 2030 年 ， 高 校 论文 没有 以 前 这 么 简单 了 ， 经 济 学 的 论文 要 
像 生物 医药 的 论文 一 样 ， 必 须要 有 详细 的 数据 支撑 ,仅仅 是 概述 性 的 东西 
导师 是 不 会 认可 的 ， 也 没有 地 方 愿意 发 表 。 

王 素 为 了 得 到 数据 ， 来 到 位 于 长 三 角 的 一 个 小 镇 ， 它 是 中 国 数据 图 书 
馆 的 发 起 者 之 一 ， 也 是 现在 数据 存储 的 主要 云 数 据 中 心 之 一 。 这 个 小 镇 是 
由 一 个 具有 百年 历史 的 工业 基地 改造 的 ， 很 多 机 房 和 办 公 室 都 是 由 原来 的 
老 厂 房改 造 而 来 的 。 

那么 ， 王 素 为 什么 要 跑 这 么 远 来 到 这 个 小 镇 上 呢 ? 数据 图 书馆 虽然 是 
一 个 基于 网 络 的 分 布 式 图 书馆 ， 王 素 所 在 的 高 校 也 是 数据 图 书馆 联盟 的 成 


员 之 一 ， 它 也 拥有 大 部 分 数据 查询 的 权限 ， 王 素 可 以 看 到 分 布 在 全 国 多 地 
云 数 据 中 心 的 数据 。 但 有 些 数据 是 一 些 企业 的 近期 数据 ， 还 没有 到 授权 对 
外 开放 的 时 间 ， 这 些 企业 的 数据 指定 寄存 在 一 个 或 多 个 数据 图 书馆 中 ， 若 
需 访 问 只 能 在 本 地 ， 而 不 能 在 网 上 共享 。 只 有 等 到 与 这 些 数据 提供 者 签订 
的 协议 中 规定 的 时 间 ， 才 能 开放 ， 这 个 规定 时 间 一 般 是 3 一 5 年 。 因 为 企 
业 为 了 避免 过 早 开放 对 现在 的 经 营 或 者 与 相关 单位 产生 纠纷 ， 所 以 设 定 这 
样 的 期 限 。 国 家 的 数据 安全 法 也 规定 ， 根 据 数 据 诉讼 的 年 限 是 两 年 ， 在 两 
年 以 后 不 能 把 这 些 数据 作为 诉讼 的 依据 ， 即 使 是 作为 诉讼 的 来 源 也 不 行 。 
所 以 企业 数据 一 般 要 在 两 年 以 后 才能 够 上 网 。 

王 素 为 了 在 研究 中 得 到 最 新 的 数据 ， 他 必须 到 数据 寄存 最 多 的 数据 图 
书馆 所 在 地 查询 。 他 是 如 何 知道 这 个 小 镇 数据 最 多 的 呢 ? 因为 在 学 校 的 数 
据 图 书馆 里 可 以 查询 到 所 有 的 数据 目录 和 数据 更 新 的 最 后 时 间 ， 他 在 学 校 
做 了 一 些 功课 ， 将 数据 的 目录 列 出 来 ， 并 且 对 数据 存储 的 地 点 进行 第 选 ， 
从 而 发 现 这 个 小 镇 作为 数据 图 书馆 的 发 起 人 之 一 数据 最 多 ， 所 以 王 素 决定 
到 这 个 小 镇 来 寻找 数据 。 当 然 ， 如 果 他 通过 对 搜集 数据 分 析 ， 发 现 他 的 论 
据 还 不 够 充足 ， 也 可 以 到 其 他 数据 图 书馆 去 查询 。 

王 素 在 这 个 小 镇 住 下 之 后 ， 第 二 天 就 赁 着 在 学 校 里 的 数据 图 书馆 证 顺 
利 进 入 数据 图 书馆 。 他 用 馆 里 的 计算 机 ,访问 未 接 入 互联 网 的 私有 云 数据 
服务 器 ， 找 到 相关 的 数据 目录 ， 在 数据 目录 中 找到 产生 数据 的 软件 供应 商 
名 称 、 产 品名 称 、 版 本 号 ， 还 有 详细 描述 数据 库 结构 的 数据 字典 。 

这 些 数据 主要 来 自 企 业 的 ERP 系统 和 工资 管理 系统 ， 从 ERP 系统 里 
可 以 看 到 这 些 企业 每 年 的 销售 收入 和 成 本 支出 ， 从 工资 管理 系统 里 他 可 以 
看 到 员工 人 数 、 工 资 总 额 、 人 均 工 资 及 加 班 、 补 贴 情 况 。 他 从 中 选取 了 十 
家 企业 ， 其 中 有 五 家 用 的 是 同一 家 软件 公司 的 产品 ， 还 有 五 家 分 别 用 了 两 
家 软件 公司 的 产品 ， 即 总 共有 三 种 软件 。 

王 素 根 据 其 中 一 家 软件 公司 产品 的 数据 字典 ， 编 写 了 一 些 SQL 语句 来 
读 取 数 据 ， 经 测试 通过 后 ， 根 据 其 他 两 家 软件 公司 的 数据 字典 进行 修改 ， 最 
后 变 成 三 组 SQL 语句 。 这 样 ， 他 就 可 以 执行 这 些 语句 查 到 相关 的 合计 数据 。 

根据 数据 图 书馆 的 规定 ， 原 始 数据 只 能 读 而 不 能 下 载 ， 但 通过 SQL 语 
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和 句 处 理 的 合计 数据 可 以 下 载 ， 之 后 再 通过 专用 的 邮件 系统 发 到 自己 的 邮箱 
里 。 这 个 邮件 系统 是 数据 图 书馆 专门 开发 的 ， 它 有 数据 审核 功能 ， 主 要 是 
为 了 审核 数据 量 ， 如 果 数据 量 太 大 就 证 明了 你 在 下 载 数据 ,这 是 不 允许 的 ; 
第 二 个 是 对 数据 进行 脱 敏 ， 有 些 涉 及 人 名 或 者 是 企业 名 称 的 数据 是 不 允许 
发 送出 去 的 。 经 过 这 样 的 方式 ， 王 素 把 取出 的 统计 数据 发 送 到 自己 的 邮箱 
里 ， 然 后 他 可 以 通过 可 视 化 工具 对 数据 进行 分 析 或 者 生成 统计 图 形 ， 再 把 
这 些 数据 谋 到 自己 的 论文 里 发 表 。 在 论文 里 他 必须 注 明 数 据 来自 哪 家 数据 
图 书馆 ， 以 及 数据 库 的 编码 。 作 为 论文 的 读者 ， 若 是 想 验证 这 些 数据 ， 仍 
然 可 以 到 这 家 数据 图 书馆 去 获得 。 

王 素 的 论文 由 于 数据 翔实 、 分 析 透 彻 ， 得 到 导师 的 好 评 ， 并 最 终 发 表 
在 一 个 著名 经 济 学 刊物 上 。 


第 4 章 
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大 数据 成 为 推动 经 济 转型 发 展 
的 新 动力 。 以 数据 流 引 领 技术 流 、 物 
质 流 、 资 金 流 、 人 才 流 ， 将 深刻 影响 
社会 分 工 协作 的 组 织 模式 ,促进 生产 
组 织 方式 的 集约 和 创新 。 大 数据 推动 
社会 生产 要 素 的 网 络 化 共享 、 集 约 化 
整合 、 协 作 化 开发 和 高 效 化 利用 ， 改 
变 了 传统 的 生产 方式 和 经 济 运行 机 
制 ， 可 显著 提升 经 济 运行 水 平和 效 
率 。 大 数据 持续 激发 商业 模式 创新 ， 
不 断 催生 新 业态 ， 已 成 为 互联 网 等 新 
兴 领 域 促 进 业 务 创新 增值 、 提 升 企业 
核心 价值 的 重要 驱动 力 。 大 数据 产业 
正在 成 为 新 的 经 济 增长 点 ， 将 对 未 来 
信息 产业 格局 产生 重要 影响 。 
国务 院 《 促 进 大 数据 发 展 行动 
纲要 》 
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4.1 数据 用 于 决策 支持 


4.1.1 数据 分 析 需 要 统计 而 不 是 检索 


在 信息 时 代 已 积累 了 很 多 数据 ， 成 熟 的 数据 管理 主要 是 用 关系 数据 库 
技术 处 理 结构 化 数据 。 随 着 大 数据 技术 的 发 展 ， 面 向 非 结构 化 数据 的 关系 
数据 库 技术 及 分 布 式 数据 库 技术 逐渐 成 熟 。 

数据 的 应 用 基本 有 两 种 形式 ; 一 种 是 数据 的 检索 ， 它 的 特征 就 是 不 管 
数据 量 有 多 大 ， 我 们 只 找 需要 的 数据 ;第 二 种 形式 是 数据 的 统计 分 析 ， 它 的 
特征 就 是 对 单个 数据 并 不 感 兴趣 ， 主 要 是 一 个 数据 集 表现 出 来 的 总 体 情况 。 

在 数据 分 析 中 ， 数 据 的 准确 性 并 不 太 重要 ， 因 为 一 个 大 的 数据 集中 即 
使 个 别 数据 出 现 异 常 ， 是 不 会 影响 到 合计 或 者 平均 值 的 。 

现在 数据 的 大 量 应 用 都 是 一 种 特定 形式 的 数据 库 检 索 。 比 如 说 搜索 引 
擎 ， 理 论 上 可 以 搜索 在 网 络 上 的 所 有 信息 ， 但 我 们 常常 关注 的 是 符合 搜索 
条 件 的 其 中 一 个 或 者 多 个 数据 。 同 样 ， 许 多 软件 提供 的 检索 功能 、 检 索 的 
目标 也 是 得 到 所 需要 的 单个 数据 或 者 一 系列 个 体 的 数据 ， 这 种 应 用 在 数据 
时 代 并 不 是 主流 技术 。 

数据 时 代 的 主流 技术 是 统计 分 析 技术 。 因 为 数据 分 析 主要 是 找 出 它 的 
统计 规律 而 不 是 单个 数据 的 内 容 。 

比如 , 有 一 个 人 想 出 租 一 套房 子 , 市 场 上 可 能 有 100 个 人 有 租房 的 意向 ， 
假如 这 个 人 能 够 看 到 这 100 个 求助 人 的 详细 信息 ， 那 他 应 该 如 何 利用 这 些 
数据 得 到 尽 可 能 高 的 租金 呢 ? 

按照 数据 库 检索 思维 ， 他 应 该 从 数据 库 里 找到 出 价 最 高 的 那个 人 ， 拿 
到 可 能 得 到 的 最 高 租金 。 但 当 他 找到 这 个 人 的 时 候 ， 有 可 能 这 个 人 已 经 租 


了 其 他 房子 ， 原 因 是 恰好 遇 到 一 个 做 中 介 的 朋友 ， 而 这 个 朋友 手 上 正好 有 
套房 ， 与 出 价 无 关 。 找 第 一 个 最 高 价 的 人 没有 成 交 ， 找 次 高 价 也 有 可 能 各 
种 因素 没有 成 交 ， 通 过 几 次 这 样 的 尝试 以 后 ， 这 个 人 觉得 单个 数据 价值 不 
大 ， 因 此 放弃 通过 数据 检索 来 寻找 高 租金 的 方法 。 

实际 上 ， 最 佳 的 方法 是 他 对 这 些 数据 进行 分 析 ， 发 现 出 价 高 的 人 是 哪 
些 职业 ， 在 哪些 区 域 上 班 ， 将 出 租 对 象 瞄准 这 些 人 ， 而 不 是 去 找 单个 的 最 
高 出 价 者 。 

找到 规律 后 ， 就 可 以 有 针对 性 地 发 布 出 租 信 息 。 比 如 发 现 某 个 高 档 办 
公 区 或 者 金融 行业 从 业 人 员 租 房 出 价 比较 高 ， 那 么 只 要 在 这 个 相关 的 区 域 
或 者 相关 的 圈子 里 发 布 信息 ， 就 能 找到 出 价 比较 高 的 人 ， 虽 然 不 能 做 到 出 
价 最 高 ， 但 它 的 效率 是 最 高 的 ， 从 而 达到 资源 最 佳 配置 的 目的 。 


4.1.2 数据 通过 辅助 决策 产生 价值 


数据 自身 不 能 产生 价值 ， 需 要 有 一 个 转化 的 过 程 。 转 换 过程 是 从 数据 
变 为 信息 ， 信 息影 响 决策 ， 决 策 产生 价值 。 在 一 个 特定 环境 中 ， 通 过 对 数 
据 的 解读 产生 信息 ， 信 息 与 环境 有 关 ， 相 同 的 数据 在 不 同 的 环境 中 可 能 会 
被 解读 为 不 同 的 信息 。 

人 们 无 时 无 刻 ， 不 管 从 事 什么 活动 ， 无 论 是 个 人 行为 还 是 集体 行为 ， 
决策 无 所 不 在 。 

与 决策 相关 联 的 行为 有 大 有 小 ， 大 的 决策 如 投资 数 亿 美元 建立 或 收购 
一 个 企业 ， 小 的 如 几 点 开车 出 门 或 走 那 条 路 。 一 个 重大 决策 常常 决定 了 很 
多 资源 的 配置 和 价值 。 

决策 的 影响 有 大 有 小 ， 一 个 大 的 错误 决策 投资 可 能 损失 几 千 万 元 ,一 
个 小 的 错误 决策 可 能 只 浪费 一 个 人 几 分 钟 。 一 个 飞机 驾驶 员 的 错误 决策 ， 
严重 的 会 导致 飞机 失事 。 

决策 实际 上 不 是 一 个 凭空 的 行为 ， 而 是 一 个 人 根据 掌握 的 信息 做 出 的 
决定 ， 这 种 信息 的 准确 来 源 就 是 数据 。 对 一 个 飞机 驾驶 员 来 说 ， 飞 机 内 部 
设备 的 运行 状况 和 外 部 的 气候 数据 是 他 做 出 决策 的 重要 依据 。 
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我 们 每 天 的 交通 出 行 ， 对 外 面 交 通 拥堵 情况 的 了 解 是 我 们 做 出 决策 的 
主要 依据 。 

能 不 能 得 到 最 全 面 准确 的 数据 ， 这 些 数 据 能 否 被 大 脑 接 受 ， 这 是 数据 
时 代 面 临 的 主要 问题 。 

数据 分 为 实时 数据 和 历史 数据 ， 一 般 认 为 实时 数据 更 有 价值 ， 因 此 对 
实时 数据 关注 更 多 ， 但 实际 上 历史 数据 价值 更 大 ， 只 是 开发 利用 的 不 够 。 

比如 ， 现 在 交通 要 道上 有 一 些 交 通 拥堵 情况 的 指示 牌 ， 用 颜色 指出 前 
面 路 段 的 拥堵 情况 , 绿色 就 是 畅通 , 黄色 就 是 有 一 点 拥堵 , 红色 就 是 很 拥堵 ， 
司机 根据 这 些 数据 决定 直行 还 是 绕道 ， 这 种 数据 特征 : 一 是 通过 实时 采集 
的 数据 ， 二 是 通过 可 视 化 的 方式 显示 在 路 牌 上 ， 让 司机 非常 快速 地 获知 前 
面 路 段 或 相关 路 段 情 况 。 实 际 上 ， 这 些 指示 牌 效 果 还 是 有 限 的 ， 毕 竟 车 子 
已 经 出 门 。 驾 驶 员 本 来 可 以 有 更 多 的 选择 ， 或 者 早点 上 路 或 者 晚点 上 路 ， 
甚至 改天 上 路 ， 等 到 了 路 上 只 能 选择 改道 ， 选 择 很 有 限 ， 而 出 门 一 般 选 的 
路 肯定 是 最 近 的 路 ， 绕 路 的 话 虽 然 时 间 会 节约 ， 但 燃油 成 本 会 增加 。 如 果 
能 预先 做 决策 ， 就 需要 不 仅仅 收集 实时 的 数据 ， 更 重要 的 是 历史 数据 。 可 
以 通过 历史 数据 判断 每 天 下 午 4 点 半 到 5 点 半 下 班 高 峰 时 间 路 上 肯定 是 堵 
的 ， 这 样 的 话 可 以 选择 早 走 或 者 晚 走 ， 所 以 历史 数据 比 实时 数据 更 有 价值 。 

信息 通过 提炼 规律 可 以 转换 为 知识 ， 有 人 认为 是 通过 知识 辅助 决策 的 。 
显然 决策 离 不 开 知识 ， 决 策 是 有 知识 的 人 利用 信息 做 出 的 选择 。 决 策 者 的 
知识 可 以 来 源 于 信息 ， 但 这 不 是 决策 的 前 提 ， 因 为 更 多 情况 是 利用 老 知 识 ， 
只 有 在 做 出 多 个 决策 后 才能 增加 新 知识 。 


4. 1.3 两 类 完全 不 同 的 程序 


很 多 程序 员 都 没有 意识 到 ， 世 界 上 竟然 存在 两 类 不 同 的 程序 。 大 家 都 
以 为 ， 程 序 都 是 用 Java、C# 等 语言 编程 ， 用 关系 数据 库 管 理 数据 。 他 们 
对 有 的 项 目 很 长 时 间 不 能 收尾 ， 客 户 需求 总 是 难以 满足 感到 困惑 。 

如 果 大 家 思考 一 下 ， 这 种 客户 需求 经 常 变化 的 情况 是 否 发 生 在 项 目 最 
后 的 报表 阶段 ， 如 果 是 ， 那 就 不 是 你 的 问题 了 ， 因 为 这 个 问题 只 有 用 另 一 


类 程序 才能 解决 。 

现在 开发 出 的 程序 很 多 ， 从 事 程 序 员工 作 的 人 很 多 ， 但 做 的 都 是 同一 
类 软件 一 -事务 处 理 软 件 , 而 报表 属于 另 一 类 被 称 为 决策 支持 系统 的 软件 。 

在 涂 子 沛 的 《大 数据 》 品 一 书 中 ， 描 述 了 决策 支持 软件 的 发 展 历史 。 
1947 年 ， 即 人 类 第 一 台 计 算 机 问世 的 第 二 年 ， 卡 内 基 梅 隆 大 学 的 赫 伯 
特 ，。 西 蒙 开始 了 决策 支持 系统 的 研究 。20 世纪 70 年 代 ， 麻 省 理工 学 院 的 
研究 人 员 第 一 次 提出 ， 决 策 支持 系统 和 运营 信息 系统 截然 不 同 ， 必 须 分 
开 。1988 年 ，IBM 公司 的 两 名 研究 员 提出 一 个 新 名 词 : 数据 仓库 (data 
warehouse) 。1992 年 ， 比 尔 。 恩 门 第 一 次 给 出 数据 仓库 的 清晰 定义 和 操 
作 性 很 强 的 实战 法 则 ， 被 誉 为 “数据 仓库 之 父 ”。1996 年 ， 拉 尔 夫 。 金 博 
尔 提 出 “数据 集 市 ” (data mart) 。1993 年 发 明 关 系数 据 库 的 科 德 详细 阁 
述 了 联机 分 析 (OLAP) 的 定义 。2000 年 以 后 ， 决 策 支持 系统 的 理念 和 架 
构 才 完全 成 熟 ， 很 多 主流 的 软件 公司 ， 如 Oracle、IBM、 微 软 、SAP 通过 
自主 开发 和 并 购 推出 各 自 的 称 为 BI 的 产品 。 

决策 支持 系统 的 技术 包括 ETL、OLAP、 报 表 、 可 视 化 、 数 据 挖掘 等 ， 
无 论 开发 思路 、 开 发 使 用 技术 和 工具 都 和 一 般 事务 处 理 程序 不 同 ， 所 以 它 
是 完全 不 同 的 另 一 类 程序 。 


4.1.4 传统 商业 智能 模式 的 沦落 


虽然 商业 智能 在 2000 年 以 后 理念 和 架构 才 成 熟 ，2010 年 进入 高 潮 ， 
出 现 大量 的 并 购 交 易 ， 大 型 软件 公司 都 通过 自主 开发 和 并 购 建立 自己 完整 
的 产品 线 ， 但 到 现在 ， 创 新 已 经 停滞， 市 场 大 幅 下 滑 。 经 历 从 商业 智能 到 
商务 分 析 的 改名 ， 却 逐渐 走 入 黄昏 ， 很 多 从 业 人 员 已 经 改行 。 

Gartner 2016 发 布 的 BI 和 分 析 魔 力 象限 包 印证 了 这 种 趋势 。 在 这 幅 图 
中 ( 见 图 4-1) 可 以 看 到 ，2016 年 ， 传 统 BI 厂商 集体 沦陷 ， 全 部 被 驱除 出 
了 领导 象限 。IBM、SAP、SAS、Microstrategy 等 无 一 幸免 ，Oracle 甚至 
已 经 完全 消失 。 
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图 4-1 Gartner 2016 BI 和 分 析 魔 力 象限 


传统 BI 厂商 的 沦落 有 好 多 原因 ， 比 如 来 自 并 购 的 不 同 产 品 集成 度 差 ， 
相关 联 问 题 分 割 成 不 同 层面 ， 用 不 同方 法 、 不 同 软 件 产 品 去 解决 ， 但 核心 
问题 是 无 法 满足 客户 需求 ， 用 开发 事务 处 理 软件 的 流程 去 开发 决策 支持 系 
统 。 比 尔 * 恩 门 的 书 2 中 明确 提出 ， 开 发 决策 支持 系统 要 先 有 程序 ， 后 有 
需求 ， 但 实际 开发 中 还 是 要 求 客户 先 提 需 求 ， 因 为 客户 无 法 提出 需求 ， 或 
需求 不 全 面 将 导致 项 目 完成 后 新 需求 无 法 满足 ， 会 影响 客户 的 满意 度 。 

如 果 没 有 解决 好 需求 问题 ， 商 业 智能 发 展 仍然 死路 一 条 。Gartner 推崇 
的 以 业务 用 户 为 中 心 的 自助 分 析 工 具 或 平台 ， 仍 然 没 有 解决 这 个 问题 ， 只 
不 过 把 需求 这 个 难题 由 IT 人 员 交 给 了 业务 人 员 。 虽 然 业 务 人 员 相 比 IT 人 
员 更 了 解 需求 ， 但 仍然 有 许多 当前 没有 想到 、 没 有 遇 到 的 需求 。 此 外 ， 由 
业务 人 员 使 用 的 自助 分 析 程序 ， 加 大 业务 人 员 素 质 要 求 、 增 加 工作 量 ， 会 


提升 企业 的 用 工 成 本 ， 而 且 很 多 工作 成 果 难 以 共享 。 
传统 BI 厂商 的 技术 和 产品 还 是 有 价值 的 , 如 ETL 和 OLAP 服务 器 技术 ， 
但 开发 思路 需要 改变 ， 要 能 基于 无 需求 进行 开发 。 


4.1.5 像 应 一样 看 数据 


在 我 们 拥有 数据 以 后 ， 如 何 让 数据 发 挥 作用 ? 

数据 发 挥 作 用 的 方式 有 两 种 : 辅助 决策 和 数据 驱动 。 数 据 驱动 指 在 业 
务 运作 流程 中 以 数据 结果 为 运作 目标 ， 以 关键 数据 为 触发 方式 ， 借 助 计算 
机 相关 技术 结合 企业 内 部 流程 和 机 制 形成 数据 一 体 化 的 工作 流程 。 

数据 驱动 不 需要 人 为 干涉 ， 但 这 种 方式 带 有 明显 的 局 限 性 : 第 一 ， 它 
可 能 是 一 种 个 性 化 的 开发 ， 成 本 比较 高 ， 第 二 ， 它 开发 的 目标 比较 单纯 ， 
不 具备 通用 性 。 

相对 数据 驱动 ， 辅 助 决策 能 够 产生 更 大 价值 。 辅 助 决策 要 求 能 看 懂 数 
据 。 那 么 ， 理 想 状 况 下 ， 我 们 应 该 怎么 样 去 看 数据 呢 ? 

人 们 都 想像 鹰 一 样 能 在 天 空 贡 翔 。 如 果 从 鹰 的 视角 来 看 ， 觉 得 自己 非 
常 自 如 ， 能 飞 在 很 高 的 天 上 ， 看 到 很 广阔 的 地 域 。 假 设 把 视野 所 及 地 域 铺 
满 数据 ， 或 者 想象 这 片 地 域 是 由 大 数据 组 成 的 ， 那 么 飞 得 越 高 ， 看 到 得 数 
据 就 越 多 。 

座 可 以 看 得 比较 宏观 ， 但 它 又 可 以 随意 地 调整 高 度 ， 缩 小 在 自己 视野 
里 的 区 域 ， 甚 至 在 发 现 一 个 猎物 时 ， 它 可 以 从 很 高 的 天 空 俯冲 下 来 直 扑 地 
上 的 一 个 点 。 鹰 眼 非常 符合 我 们 看 数据 的 要 求 。 

在 看 数据 时 ， 宏 观 和 微观 怎样 融合 ， 怎 样 自如 地 切换 ? 从 鹰 的 行为 可 
以 出 来 ， 宏 观 和 微观 各 有 所 长 ， 没 有 宏观 的 视野 它 很 难 在 一 个 广大 的 区 域 
里 找到 猎物 ， 如 果 没 有 微观 捕获 猎物 的 技术 它 就 无 法 获取 猎物 ， 所 以 两 种 
技巧 都 需要 。 

实际 上 ， 在 网 上 应 用 地 图 的 时 ， 我 们 已 经 拥有 类 似 的 视野 。 我 们 可 以 
在 网 页 上 打开 一 份 世界 地 图 ， 然 后 用 鼠标 任意 缩放 ， 通 过 鼠标 滚轮 将 它 缩 
小 到 一 个 国家 、 一 个 城市 甚至 一 条 街道 。 这 种 数据 组 织 方式 的 特点 是 ， 虽 
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然 拥 有 非常 大 的 数据 集 ， 但 不 会 一 下 子 被 这 么 多 数据 包围 ， 总 是 可 以 看 到 
一 个 小 的 ， 人 能 够 接受 的 数据 集 。 比 如 在 世界 地 图 上 ， 只 显示 一 些 国 家 的 
名 称 和 主要 大 城市 的 名 称 ， 明 显 只 是 一 个 小 数据 ， 但 放大 到 一 个 国家 以 后 ， 
可 能 就 把 这 个 国家 的 一 些 详细 数据 显示 出 来 ， 展 示 这 个 国家 重要 地 区 的 省 
份 或 者 城市 ， 再 缩小 地 图 ， 才 会 显示 一 些 更 小 的 街道 。 

同样 ， 在 利用 普通 数据 时 ， 虽 然 不 能 像 地 图 一 样 按 区 域 或 城市 的 级 别 
确定 数据 是 否 显示 ， 但 可 以 通过 数据 的 合计 和 平均 值 来 达到 类 似 的 目的 。 
也 就 是 说 ， 可 以 从 比较 大 的 数据 集 的 合计 看 到 组 成 大 数据 集 的 相对 比较 小 
的 数据 集 的 合计 ， 最 后 看 到 明细 数据 。 这 就 是 为 什么 我 们 把 交互 式 可 视 化 
无 方向 数据 挖 据 这 项 技术 命名 为 “ 座 眼 ”技术 的 原因 ， 通 过 这 种 技术 ， 利 
用 数据 的 钻 取 操作 ， 可 以 使 你 具有 鹰 一 样 的 眼睛 ， 在 大 数据 中 找到 你 所 需 
要 的 信息 。 


4.1.6 数据 一 致 性 不 是 分 析 的 先决 条 件 


在 数据 分 析 时 ， 会 发 现 应 该 相同 的 数据 出 现 了 不 一 致 ， 比 如 合同 数 和 
发 货 数 不 同 ， 生 产 成 品 数 和 入 库 数 不 同 。 出 现 这 种 情况 一 般 有 两 种 原因 
业务 流程 控制 不 严 和 不 同 信息 系统 的 主 数据 定义 不 一 致 。 

出 现 数据 不 一 致 ， 是 否 说 明 信 息 化 水 平 不 够 ， 还 不 具备 做 数据 分 析 ， 
或 者 决策 支持 系统 的 条 件 呢 ? 

实际 上 ， 决 策 支持 系统 和 事务 处 理 不 同 ， 即 使 数据 不 一 致 ， 也 不 影响 
使 用 。 而 且 ， 将 两 种 完全 不 一 样 的 数据 放 在 一 起 比较 ， 就 能 通过 数据 分 析 
发 现 管理 中 的 问题 ， 并 找到 问题 出 现 的 原因 。 

不 像 事 务 处 理 系统 ， 数 据 前 后 必须 对 应 。 在 数据 分 析 中 ， 无 论 是 同一 
个 软件 中 的 不 同 数据 ， 还 是 来 自 不 同 软件 的 数据 ， 都 可 以 放 在 一 起 显示 ， 
并 不 强迫 数据 必须 保持 一 致 。 比 如 ， 企 业 销 售 中 有 多 个 环节 : 合同 、 订 单 、 
发 货 、 出 库 , 理论 上 来 说 这 四 个 数据 应 该 一 致 , 而 实际 业务 操作 时 并 非 如 此 ， 
经 常 出 现 没 有 订单 就 发 货 的 情况 。 如 何 保持 数据 一 致 ， 是 公司 管理 规定 的 
执行 或 事务 处 理 软 件 流程 控制 问题 ， 与 数据 分 析 无 关 。 而 且 把 四 个 数据 放 


在 一 起 比较 ， 管 理 者 会 很 明显 地 看 出 数据 的 不 一 致 ， 会 根据 企业 管理 实际 
追 责 或 调整 。 到 底数 据 的 不 一 致 合理 与 否 ， 是 人 为 录入 错误 ， 还 是 适应 市 
场 的 无 奈 之 举 ， 是 否 需要 改进 ， 都 是 一 个 管理 决策 问题 ， 应 交 由 业务 部 门 
而 不 是 数据 分 析 人 员 处 理 。 数 据 分析 人 员 只 是 提供 一 个 决策 的 辅助 系统 ， 
也 就 是 把 数据 是 否 一 致 的 信息 准确 地 传递 给 决策 者 ， 而 让 决策 者 判断 其 正 
确 与 否 。 

从 另 一 个 角度 看 ， 任 何 一 个 信息 系统 或 企业 管理 制度 都 需要 不 断 地 反 
馈 ， 比 如 按 公 司 规定 出 库 必 须 有 订单 ， 但 老 客户 没有 订单 发 不 发 货 ? 因此 ， 
规定 和 实际 总 有 了 矛盾， 上 级 要 求 与 下 级 执行 也 会 有 出 入 。 

假设 在 数据 分 析 里 ， 把 订单 数据 和 出 库 数据 及 时 反馈 给 决策 者 ， 就 可 
以 明显 地 看 出 管理 制度 实际 执行 的 差异 。 因 此 ， 通 过 数据 分 析 建 立 反 馈 机 
制 ， 让 业务 部 门 决策 者 看 到 自己 的 决策 是 否 被 执行 ， 才 有 利于 具体 工作 的 
落实 。 

如 果 数 据 分 析 需 要 等 待 数据 的 一 致 性 ， 而 数据 的 一 致 性 问题 由 于 没有 
得 到 及 时 的 反馈 、 检 查 和 督促 ， 很 长 时 间 不 能 解决 ， 那 么 数据 的 一 致 性 将 
永远 达 不 到 应 有 的 水 平 。 

所 以 ， 数 据 一 致 性 应 该 是 业务 部 门 在 事务 处 理 中 不 断 调整 的 结果 ， 而 
不 是 数据 分 析 的 前 提 。 


4.1.7 从 数据 比较 中 发 现价 值 


对 于 事务 处 理 软件 开发 而 言 ， 数 据 的 一 致 性 很 重要 。 比 如 说 一 个 企业 
ERP 软件 中 合同 的 订单 数量 和 仓库 的 发 货 数量 ， 以 及 最 后 收 款 金额 应 该 有 
对 应 关系 ， 如 果 流 程 上 出 现 问题 少 收 款 ， 就 说 明 企业 在 管理 上 存在 问题 。 

在 数据 分 析 中 ， 对 不 同系 统 的 数据 如 何 一 致 ， 是 一 个 困扰 IT 人 员 的 难 
题 。MES 的 产量 数据 怎么 和 ERP 的 入 库 数据 相 一 致 ? 因为 处 于 完全 不 同 
的 信息 系统 、 不 同 的 数据 库 中 ， 要 一 致 比较 困难 。 如 果 等 数据 都 一 致 ， 再 
做 数据 分 析 和 决策 支持 ， 显 然 对 基础 数据 的 要 求 就 太 高 了 。 

要 求 数据 的 完全 一 致 ， 是 一 个 事务 处 理 的 思维 而 不 是 一 个 决策 支持 的 
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思维 。 这 个 思维 的 主要 缺陷 就 是 认为 信息 系统 是 完美 的 、 可 以 在 逻辑 上 完 
全 一 致 的 ， 完 全 排除 了 人 的 作用 。 

实际 上 ， 数 据 分 析 技 术 的 核心 不 在 于 数据 的 一 致 性 ， 而 在 于 要 让 这 些 
数据 被 人 的 大 脑 所 认 知 。 比 如 ， 销 售 合同 数 和 仓库 发 货 数 应 该 一 致 ， 如 何 
防止 不 一 致 的 情况 出 现 呢 ? 按 事务 处 理 软件 的 流程 控制 思路 ， 这 种 一 致 性 
应 该 由 软件 控制 。 但 是 ， 从 数据 分 析 技 术 来 说 ， 应 该 由 人 来 控制 ， 即 把 合 
同 数 和 出 库 数 同时 展示 给 决策 者 ， 由 他 来 判断 这 里 面 的 不 一 致 是 否 合理 。 
当然 ， 他 看 到 的 数据 不 仅仅 是 总 额 的 区 别 ， 可 以 按 客户 、 存 货 的 品种 去 分 
析 哪 里 不 同 ， 甚 至 按时 间 对 两 种 数据 的 差异 进行 比较 。 

同样 ， 对 来 自 MES 的 产量 和 ERP 的 入 库 数 的 差异 ， 也 是 把 相关 的 数 
据 展示 出 来 ， 让 决策 者 去 分 析 。 这 样 的 话 ， 对 数据 源 的 数据 一 致 性 要 求 大 
大 降低 ， 充 分 发 挥 了 人 脑 的 作用 。 这 样 处 理 有 利于 决策 者 通过 发 现 数据 的 
异常 来 去 不 断 地 调整 ， 也 许 最 终 的 目标 数据 是 一 致 的 。 但 这 一 致 的 过 程 不 
是 说 技术 人 员 层 面 就 能 搞定 的 ， 而 是 需要 在 决策 人 层面 提出 要 求 ， 因 为 这 
个 不 一 致 可 能 涉及 业务 流程 的 重新 设计 ， 涉 及 不 同业 务 人 员 的 调配 、 工 作 
责任 心 和 录入 数据 的 及 时 性 。 这 些 问 题 不 是 IT 人 员 能 够 处 理 的 ， 需 要 从 公 
司 的 角度 协调 多 方面 的 力量 共同 解决 。 只 有 达到 这 样 的 目的 ， 决 策 支持 系 
统 的 目标 才能 实现 。 


4.1.8 保障 决策 者 的 决策 思维 流 


笔者 有 一 个 大 学 同学 是 杭州 一 家 汽车 配件 企业 的 总 经 理 ， 笔 者 曾 在 他 
们 公司 和 他 共同 研究 了 利用 ERP 数据 的 决策 过 程 。 

他 们 用 ERP 已 经 好 多 年 ， 还 是 当初 利用 政府 补贴 购置 的 。 笔 者 坐 在 他 
的 办 公 桌 前 , 看 着 他 操作 软件 , 调用 菜单 查询 。 他 查 到 公司 当年 销售 额 数据 ， 
发 现 销售 额 只 有 当年 、 上 年 同期 、 同 比 增加 额 的 数值 ， 没 有 计算 同比 的 百 
分 比值 ， 更 没有 图 形 。 他 想 进一步 了 解 销售 额 的 分 布 ， 需 要 打开 另外 一 个 
菜单 才能 看 到 按 客户 或 产品 的 销售 额 分 布 ， 找 到 销售 额 增加 或 减少 的 原因 。 

于 是 ， 我 们 发 现 这 种 查询 ， 导 致 一 种 可 称 为 决策 思维 流 的 中 断 问 题 ， 


决策 支持 系统 的 一 个 重要 的 功能 就 是 要 满足 管理 者 决策 思维 流 的 需要 。 

大 家 知道 ， 在 电影 中 有 一 种 技术 叫 意识 流 ， 这 个 是 电影 的 一 个 表现 手 
法 。 在 电影 上 可 能 看 到 一 些 跳跃 的 画面 ， 表 面 看 没有 很 明确 的 时 间 关 系 ， 
但 它 符合 人 类 大 脑 在 思考 问题 时 意识 不 断 跳跃 和 流动 的 过 程 ， 所 以 在 电影 
手法 中 称 为 意识 流 。 意 识 流 在 刚 出 现 的 时 候 有 些 观众 难以 理解 ， 但 随 着 几 
十 年 下 来 不 断 地 普及 ， 观 众 对 电影 意识 流 的 手法 慢 慢 就 熟悉 了 。 

同样 的 ， 在 我 们 决策 者 思考 问题 的 时 候 也 有 一 个 流 ， 可 称 为 决策 思维 
流 。 一 个 决策 者 在 发 现 一 个 问题 后 ， 肯 定 需要 对 这 个 问题 做 进一步 的 思考 。 
比如 说 ， 企 业 在 发 现 销售 额 下 降 以 后 ， 就 会 想 销售 额 下 降 是 什么 原因 引起 
的 ， 是 哪个 区 域 销量 下 降 了 ， 还 是 哪个 产品 的 销量 下 降 了 。 如 果 一 个 区 域 
的 销量 下 降 了 ， 会 想 是 这 个 区 域 里 所 有 客户 的 采购 量 都 下 降 了 ， 还 是 某 个 
客户 的 采购 量 下 降 ， 如 果 是 某 个 客户 下 降 ， 要 知道 是 他 采购 的 所 有 产品 量 
都 下 降 ， 还 是 某 个 产品 的 采购 量 下 降 。 如 此 这 般 ， 就 会 形成 一 个 思维 流 。 

一 个 决策 支持 系统 应 该 具备 什么 功能 才能 满足 决策 思维 流 的 需要 呢 ? 

首先 ， 发 现 问题 都 是 随机 的 。 可 能 是 自己 分 析 数 据 的 时 候 ， 看 经 营 数 
据 的 仪表 盘 时 发 现 的 问题 ， 也 有 可 能 是 下 属 汇 报时 的 问题 。 可 能 是 销售 的 
问题 ， 或 者 是 收 款 问题 ， 也 可 能 是 库存 问题 。 由 于 问题 都 是 随机 的 ， 所 以 
当 问 题 出 现时 ， 要 能 及 时 提供 相应 的 数据 。 

其 次 ， 要 为 思维 流 的 流动 提供 进一步 的 操作 功能 ， 比 如 可 以 进行 数据 
钻 取 、 变 化 维度 查询 。 

最 后 ， 数 据 显 示 的 速度 要 非常 快 ， 要 跟 上 决策 者 思考 的 节奏 。 比 如 说 
当 这 个 区 域 销量 下 降 之 后 ， 要 了 解 是 哪个 客户 下 降 了 ， 就 要 马上 看 到 这 个 
区 域 所 有 客户 销售 的 同比 数据 。 

如 果 由 于 技术 的 限制 ， 当 他 想到 下 一 个 问题 的 时 候 需 要 别人 协助 ， 思 
维 流 就 会 中 断 。 比 如 ， 如 果 一 个 区 域 客户 的 销售 同比 没有 计算 出 来 ， 并 且 
没有 图 形 化 ， 如 果 他 需要 业务 部 门 或 者 秘书 来 做 这 个 图 形 的 话 ， 这 个 问题 
他 今天 就 无 法 思考 下 去 ， 他 也 不 可 能 再 去 提 下 一 个 问题 。 

如 果 数 据 统计 或 显示 很 慢 ， 比 如 要 第 二 天 或 者 要 过 一 个 小 时 才能 提供 
数据 ， 这 个 问题 也 无 法 按照 思维 流 进行 下 去 ， 问 题 可 能 就 搁置 下 来 。 等 下 


对 几 沛 手 导 洗 | 册 和 潜 


后 


| 103 





“十 岂 咒 玉 。 


音 灯 着 渡 ，, 济 过 泻 将 证 仿 满 琶 汗 


kt 


104| 


次 有 了 这 幅 图 ， 他 回想 起 这 个 问题 ， 发 现 有 一 个 客户 确实 下 降 了 ， 再 去 找 
哪 一 个 产品 下 降 的 时 候 又 拿 不 出 数据 。 如 此 这 般 ， 他 就 无 法 按照 这 种 方式 
去 思考 。 

我 们 可 以 想象 ， 如 果 按 照 这 个 思路 一 直 想 下 去 就 是 这 个 结果 。 如 果 你 
打 断 了 思路 ， 可 能 就 得 按 另 外 一 个 思路 去 思考 ， 很 难 回 到 原来 的 思路 上 去 。 

所 以 作为 决策 支持 系统 ， 它 的 目标 就 是 要 满足 人 们 对 决策 思维 流 的 需 
要 。 应 该 说 ， 如 果 软 件 不 行 要 做 软件 ， 硬 件 不 行 要 升级 硬件 ， 这 样 才能 真 
正 满足 决策 者 的 需求 ， 充 分 提高 决策 的 效率 。 


4. 1.9 建立 基于 可 视 化 数据 的 指控 室 


一 个 组 织 无 论 是 政府 部 门 还 是 企业 都 应 该 有 一 个 指挥 室 ， 就 像 军队 的 
指挥 室 一 样 。 现 在 有 些 政府 机 构 已 有 类 似 指挥 室 的 地 方 ， 有 了 指挥 室 的 欠 
形 ， 但 基本 以 视频 监控 为 主 。 视 频 监控 提示 的 是 实时 视频 信息 ， 缺 少数 据 
信息 。 在 一 些 企业 ， 商 业 智 能 公司 开发 了 数据 可 视 化 系统 ， 在 上 面 显 示 公 
司 的 实时 经 营 数 据 , 类 似 于 军队 指挥 室 里 面 布置 的 是 沙盘 、 地 图 , 见 图 4-2。 

一 个 指挥 室 应 该 以 决策 支持 系统 为 主 ， 而 决策 支持 系统 应 该 以 数据 为 
主 ， 数 据 除 可 监控 最 新 经 营 状 况 外 ， 还 可 观察 历史 数据 的 变化 ， 多 维度 对 
数据 进行 分 析 。 

指挥 室 不 是 一 个 监控 室 ， 监 控 室 作为 组 织 的 日 常事 务 处 理 部 门 主要 应 
对 突 发 的 事件 。 指 挥 室 应 该 不 是 用 于 程序 化 的 突 发 情况 的 处 理 ， 而 是 要 做 
一 些 对 公司 有 比较 深远 影响 的 战略 决策 ， 这 些 决 策 更 多 要 依赖 历史 数据 去 
分 析 问 题 ， 并 且 要 对 决策 的 长 远 效果 做 出 反馈 和 评估 。 

指挥 室 有 两 种 布置 : 一 种 为 影院 式 ， 即 大 屏幕 放 在 前 面 ， 后 面 椅子 
直 对 屏幕 ， 可 称 为 老板 指挥 室 ， 主 要 适合 以 老板 为 核心 的 管理 团队 来 进 
行 指挥 决策 。 还 有 一 种 是 围 桌 式 ， 类 似 会 议 室 ， 适 合 开 董事 会 和 办 公 例 
会 ， 对 应 有 大 屏幕 ， 屏 幕 控制 可 以 采用 触摸 屏 。 现 在 微软 推出 来 的 Surface 
Hub 是 一 种 大 屏幕 触摸 屏 ， 上 面 可 以 实现 视频 会 议 、 白 板 及 PPT 展示 等 功 
能 ， 显 示 决 策 支 持 系 统 的 话 可 以 直接 在 上 面 操 作 。 如 果 人 少 的 话 ， 可 以 在 


Surface Hub 上 面 直接 看 , 它 有 55 英寸 和 64 英 寸 两 种 规格 。 如 果 还 嫌 不 够 大 ， 
可 以 把 画面 投影 到 大 屏幕 上 ， 让 两 者 同步 。 由 于 决策 支持 系统 支持 决策 思 
维 流 ， 很 多 的 问题 在 这 个 指挥 室 里 都 可 以 解决 ， 大 大 提高 了 决策 效率 。 
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4.1.10 组 织 的 决策 支持 流程 


这 里 的 组 织 包括 政府 、 教 育 机 构 、 医 疗 机 构 、 企 业 等 。 

组 织 的 规范 决策 一 般 可 以 分 为 几 个 过 程 : 四 数据 的 收集 过 程 ，@ 数 据 
的 展现 ，@ 数 据 的 分 析 ;，@ 决 策 ，@ 决 策 结果 反馈 。 

一 个 组 织 要 进行 决策 ， 需 要 掌握 大 量 的 数据 。 就 像 战 争 中 ， 要 通过 个 
查 员 、 飞 机 、 卫 星 去 搜集 大 量 的 情报 ， 显 然 情 报 搜集 得 越 多 、 越 精确 、 越 
及 时 ， 对 决策 的 作用 也 就 越 大 。 所 以 数据 搜集 是 正确 决策 的 必要 前 提 。 

同时 , 决策 对 数据 有 几 个 要 求 : 四 拥有 数据 ; @ 看 到 数据 ; @@ 看 懂 数 据 。 

每 一 个 组 织 都 有 很 多 的 数据 来 源 : 四 人 工 直接 录入 的 数据 ; @@ 自 动 记 
录 的 人 员 活 动 数据 ; 加 设备 运行 产生 的 数据 。 
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在 企业 里 面 ， 员 工 操作 ERP 软件 录入 的 订单 的 数据 、 出 库 的 数据 、 收 
款 的 数据 等 , 是 人 为 录入 的 数据 。 网 店 的 用 户 点 击 操作 的 日 志 、 生 成 的 订单 、 
消费 的 金额 ， 员 工 的 考勤 打卡 等 ， 是 自动 记录 的 数据 。 设 备 运行 产生 用 电 、 
设备 故障 、 报 警 、 检 修 等 ， 是 机 器 运行 产生 的 数据 。 

另外 ， 在 医院 里 ， 门 诊 挂号 、 医 生 开 处 方 、 病 房 输液 操作 、 手 术 等 会 
产生 数据 ， 一 些 医疗 设备 也 会 自动 产生 数据 ， 比 如 说 久光 机 ， 开 动 时 间 、 
运行 时 间 等 。 政 府 也 有 行政 审批 、 报 警 的 数据 。 金 融 机 构 ， 有 存款 、 取 款 
等 数据 。 

要 方便 数据 搜集 工作 ， 首 先 ， 设 备 要 智能 化 ， 设 备 上 都 要 有 传感器 ， 
它 的 运行 状态 都 有 数据 输出 ; 其次， 这 些 数据 能 通过 网 络 送 到 一 个 服务 器 
中 存 起 来 。 

现在 有 些 企业 为 了 节约 成 本 ， 虽 然 购买 的 是 数控 设备 ， 但 设备 上 数控 
模块 是 选 购 的 ， 就 不 选 了 ， 所 以 这 个 设备 还 不 算 智能 化 。 有 些 企业 虽然 选 
购 了 数控 模块 ， 但 没有 联网 ， 所 以 数据 也 不 能 存储 ， 更 不 可 能 分 析 了 。 

数据 的 搜集 只 靠 设备 智能 化 是 无 法 全 面 完成 的 ， 有 些 事 还 需要 做 人 工 
处 理 。 人 工 处 理 需 要 用 到 一 些 事务 处 理 的 软件 ,比如 制造 执行 系统 (MES ) 。 
如 果 现 成 的 软件 包 适 用 的 话 可 以 采购 ， 不 适用 的 话 需要 去 定制 开发 。 

这 些 数据 都 全 了 以 后 ， 可 能 存放 在 不 同 的 系统 中 ， 这 个 时 候 需 要 开发 
一 个 数据 仓库 ， 把 这 些 分 布 在 不 同 服务 器 上 的 数据 集中 到 一 起 ， 然 后 把 数 
据 仓库 的 数据 通过 建 模 变 成 小 数据 ， 最 后 把 这 些小 数据 可 视 化 处 理 后 发 送 
给 领导 。 

领导 在 自己 的 办 公 室 里 ， 可 以 看 到 所 有 数据 源 的 数据 并 且 对 这 些 指标 
进行 监控 、 分 析 。 可 以 制作 一 个 仪表 盘 进 行 监控 ， 发 现 问题 以 后 通过 多 个 
维度 的 分 析 、 逐 级 的 数据 钻 取 来 查询 数据 ， 找 到 发 生 问题 的 人 或 设备 。 

可 以 设 定 一 个 理想 目标 : 如 果 所 有 设备 里 面 有 一 台 停 机 了 ， 这 个 停机 
的 信息 应 该 能 反映 在 老板 桌面 最 起 码 的 一 个 指标 上 ， 比 如 入 库 数量 。 因 为 
一 台 机 器 停产 ， 出 产 的 数量 就 少 了 ， 入 库 的 数量 也 会 减少 ， 继 而 在 决策 支 
持 系 统 上 就 能 看 到 入 库 数量 这 样 一 个 指标 的 变化 。 一 个 企业 如 果 有 一 百 台 、 
一 千 台 机 器 ， 一 台 机 器 的 停产 显然 是 不 会 影响 到 入 库 数 量 的 总 额 ， 但 可 以 





对 产品 入 库 数 据 再 给 出 一 个 环比 指标 来 解决 这 个 问题 。 影 响 环比 变化 的 设 
备 生产 数量 虽然 很 少 ， 但 是 一 停产 ， 和 昨天 的 环比 就 会 产生 很 大 变化 ， 这 
个 环比 的 变化 会 给 老板 一 个 异常 发 生 的 提醒 ， 他 通过 数据 钻 取 ， 可 以 逐 级 
追踪 到 具体 的 分 厂 、 车 间 ， 最 后 定位 到 这 台 设 备 。 决 策 者 会 看 到 这 台 设 备 
因 故 障 停产 了 ， 同 时 可 以 评估 这 台 设 备 的 停产 对 其 他 经 营 指标 的 影响 ， 做 
出 相应 的 决策 。 


4.1.11 宏观 和 微观 的 融合 


宏观 和 微观 指 对 同一 个 事物 不 同 的 观察 角度 。 宏 观 一 般 比较 粗 但 关注 
的 范围 比较 广 ， 而 微观 比较 细 但 关注 的 范围 比较 罕 。 

在 管理 中 微观 和 宏观 常常 是 互相 排斥 的 。 一 般 来 说 ， 领 导 的 层级 越 高 
他 看 到 的 越 宏观 。 如 果 最 高 领导 者 太 关注 微观 就 会 缺乏 宏观 的 把 控 ， 在 对 
整个 组 织 的 发 展 把 控 中 就 会 出 现 问题 。 

在 美国 击毙 拉登 这 个 事件 上 ， 通 常 总 统 只 需要 关注 宏观 的 决策 ， 就 是 
要 不 要 击 丝 拉登 ， 至 于 如 何 去 击 丝 拉 登 ， 在 什么 时 间 、 什 么 地 点 击毙 拉登 ， 
应 该 由 下 面具 体 的 执行 者 决定 ， 不 但 不 需要 总 统 来 处 理 ， 甚 至 不 需要 五 角 
大 楼 的 高 级 将 领 来 处 理 ， 只 需要 由 现场 的 海豹 突击 队 的 队长 来 处 理 就 行 。 

但 从 新 闻 中 看 到 ， 不 仅 奥巴马 全 程 参与 ， 而 且 通 过 海豹 突击 队 的 队员 
的 头盔 看 到 现场 的 视频 。 

这 样 就 带 来 一 个 问题 ， 我 们 传统 观念 中 管 宏观 的 人 不 需要 关注 微观 ， 
到 底 是 基于 人 的 精力 限制 还 是 技术 的 限制 。 精 力 限制 指 一 个 人 过 多 关注 了 
微观 就 没有 精力 关注 宏观 ， 若 是 太 关注 微观 就 会 影响 宏观 判断 。 技 术 限 制 
是 由 于 技术 的 局 限 ， 导 致 人 的 活动 范围 和 搜集 信息 详细 程度 的 能 力 受 到 现 
在 而 无 法 看 到 微观 的 信息 。 比 如 中 国 古 代 的 皇帝 是 通过 奏折 或 者 是 通报 来 
获取 下 面 的 信息 ， 这 种 奏折 由 于 是 手工 书写 的 文字 ， 所 以 不 可 能 非常 的 详 
细 ， 而 且 这 些 事情 发 生 在 全 国 各 地 ， 皇 帝 也 不 可 能 亲临 现场 ， 也 就 是 说 他 
没有 条 件 获取 微观 信息 。 

随 着 技术 的 发 展 ， 电 视 直 播 成 为 一 种 可 能 ， 也 就 是 说 作为 中 央 领 导 可 
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以 通过 直播 看 到 现场 的 情况 ， 完 全 可 以 掌握 到 相对 微观 的 信息 。 交 通 工具 
的 发 达到 达 现 场 也 成 为 一 种 可 能 。 

因此 ， 可 以 得 出 这 样 一 个 结论 ， 虽 然 从 管理 的 权限 和 层级 来 看 ， 为 了 
防止 管理 的 混乱 或 者 政 出 多 门 ， 指 令 应 该 是 逐 级 下 达 、 逐 级 执行 ， 作 为 上 
级 来 说 过 于 微观 的 命令 会 干扰 基层 领导 的 工作 。 但 从 信息 的 采集 来 说 ， 微 
观 和 宏观 却 不 应 该 有 很 大 的 差异 ， 毕 竞 有 很 多 宏观 的 信息 是 来 自 微观 的 综 
合 。 微 观 事件 的 发 生 会 有 一 个 时 间 性 ， 也 就 是 在 指定 的 时 间或 者 时 间 段 里 
微观 的 突 发 事件 总 是 不 多 的 ， 作 为 一 个 领导 来 说 完全 有 时 间 关 注 微观 信息 。 

从 来 没有 一 个 固定 模式 规定 高 层 领导 只 需要 关注 宏观 信息 ， 而 不 需要 
关注 微观 信息 。 为 了 正确 决策 ， 一 个 高 层 领导 既 要 掌握 宏观 又 要 掌握 微观 ， 
关键 是 如 何在 最 短 的 时 间 花 最 少 的 精力 获得 最 详细 的 信息 ， 怎 样 从 宏观 上 
尽 可 能 快 地 发 现 微观 的 异动 , 把 关注 点 转移 到 对 宏观 有 影响 的 微观 事件 上 ， 
并 且 迅 速 掌握 详细 的 情况 , 以 便于 协调 事情 的 处 理 , 并 得 到 处 理 结果 的 反馈 。 

作为 一 个 技术 人 员 或 者 一 个 基层 领导 ， 没 有 任何 权力 阻止 上 层 领导 获 
取 微 观 信 息 ， 反 而 要 保证 他 获取 到 最 细 粒 度 的 数据 ， 这 样 ， 这 些 信 息 可 以 
根据 宏观 管理 的 需要 去 按 需 索取 。 既 然 宏观 的 管理 影响 面 比 较 广 ， 它 的 任 
何 一 个 决策 都 会 产生 非常 大 的 价值 或 者 损失 ， 所 以 即使 这 些微 观 数据 一 年 
都 用 不 到 ， 但 只 要 用 过 一 次 ， 它 的 价值 就 完全 可 以 抵 销 它 的 成 本 。 况 且 在 
现在 的 技术 条 件 下 ， 这 种 工作 并 不 是 专门 为 宏观 决策 者 准备 的 。 也 就 是 说 ， 
宏观 决策 者 和 微观 执行 者 是 共享 数据 的 ， 只 不 过 需要 在 技术 上 将 数据 打通 ， 
所 以 这 里 面 也 并 没有 特殊 的 成 本 存在 。 

在 经 典 的 商业 智能 开发 模式 中 ， 把 宏观 和 微观 功能 人 为 地 割裂 开 来 ， 
把 系统 分 成 决策 层 、 管 理 层 和 执行 层 ， 不 但 开发 的 内 容 不 同 ， 而 且 使 用 的 
工具 也 不 同 ， 比 如 决策 层 用 仪表 板 ， 管 理 层 用 OLAP， 执 行 层 用 报表 ， 不 
能 实现 宏观 和 微观 的 融合 ， 影 响 了 作为 决策 支持 系统 的 价值 。 


4.1.12 用 过 度 设计 满足 任意 需求 


现 有 一 种 概念 ， 称 为 过 度 设 计 和 过 度 服 务 。 其 本 质 是 在 一 个 产品 的 设 


计 上 或 者 是 在 服务 上 超过 了 客户 的 需求 ， 即 过 度 了 。 

过 度 设计 是 在 产品 同 质 化 越 来 越 严 重 以 后 ， 为 了 突出 差异 性 增加 竞争 
力 才 出 现 的。 有 些 公司 在 设备 上 不 断 增 加 新 功能 ， 这 些 功能 有 些 确实 提升 
了 产品 的 效用 ， 但 有 些 没 有 作用 ， 设 计 这 些 没 用 的 功能 就 称 为 过 度 设计 。 

通过 增加 产品 的 功能 ， 而 增加 产品 和 竞争 对 手 的 差异 化 ， 是 过 度 设 计 
的 初衷 。 但 是 ， 也 有 些 公司 过 于 沉 酒 于 细节 ， 究 其 原因 是 在 大 的 方面 上 没 
有 创新 ， 只 能 集中 在 细节 上 进行 创新 ， 从 而 导致 过 度 设计 。 在 日 本 ， 很 多 
公司 把 过 度 设计 和 过 度 服务 当成 一 种 主要 的 竞争 策略 。 

就 数据 分 析 而 言 ， 过 度 设计 是 面向 需求 无 法 描述 的 现状 的 一 种 应 对 策 
略 。 客 户 能 提出 的 需求 ， 或 者 能 感觉 到 需求 ， 只 是 总 需求 的 一 小 部 分 ， 现 
在 不 需要 不 等 于 以 后 不 需要 。 如 果 一 个 系统 只 能 满足 现在 的 需求 ， 那 么 只 
要 一 有 哪怕 一 点 小 的 新 需求 就 重新 开发 升级 ， 显 然 是 不 能 被 客户 接受 的 。 

现在 很 多 公司 提供 的 自助 式 开发 工具 ， 实 际 上 是 一 种 推卸 责任 的 做 法 。 
自助 设计 是 个 非常 复杂 的 工作 ， 就 像 用 Photoshop 软件 可 以 做 出 非常 好 的 
美工 作品 ， 但 不 等 于 有 了 Photoshop 软件 之 后 随便 什么 人 就 能 设计 出 同样 
效果 的 作品 ， 这 和 操作 者 的 美术 素养 和 设计 眼光 都 有 很 大 的 关系 。 同 样 ， 
客户 要 做 好 自助 开发 不 是 件 很 容易 的 事情 。 

所 以 ， 相 对 于 客户 当前 的 需求 来 说 ， 要 满足 他 未 来 的 需求 时 ， 必 须要 
进行 过 度 设 计 。 所 以 “过 度 ”， 相 对 于 现在 的 需求 来 说 是 过 度 的 ， 但 面向 
他 的 总 需求 来 说 实际 上 还 是 不 足 的 。 

使 用 过 度 设 计 方法 开发 ， 要 求 开 发 者 的 经 验 要 高 于 所 面向 的 客户 。 在 
事务 处 理 软件 系统 开发 中 ， 很 多 跨国 公司 从 世界 范围 内 收集 一 些 好 的 实践 
案例 ， 然 后 和 客户 的 需求 结合 ， 导 致 这 些 系统 开发 出 来 比 仅 依赖 某 个 具体 
客户 的 需求 更 加 完善 。 但 在 商业 智能 系统 开发 中 ， 并 不 能 复制 类 似 的 成 功 。 

因此 ， 在 决策 支持 系统 的 开发 中 ， 靠 简单 拼凑 经 验 来 完善 需求 已 被 证 
明 此 路 不 通 ， 原 因 就 是 需求 的 范围 比 想 象 的 要 大 ， 而 且 大 得 多 。 

归纳 法 行 不 通 ， 只 有 用 演绎 法 。 可 以 根据 模型 推导 需求 ， 这 样 得 到 的 
需求 相对 而 言 科学 性 和 理论 性 都 比较 强 ， 才 能 满足 客户 的 需求 ， 如 此 多 的 
功能 对 客户 来 说 就 是 一 种 过 度 设计 。 
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面 对 过 度 设计 的 系统 ， 客 户 一 开始 会 有 些 不 适应 。 定 制 系统 都 是 根据 
客户 的 需求 来 完成 的 ， 客 户 需 求 也 是 考虑 了 好 长 时 间 。 经 过 了 长 期 的 酝酿 
和 思考 ， 开 发 者 主要 工作 是 理解 这 些 需求 ， 所 以 思路 是 跟 在 客户 的 后 面 的 ， 
程序 开发 处 理 后 客户 理解 非常 容易 。 但 经 过 过 度 设计 ， 客 户 完全 没有 准备 ， 
一 开始 时 会 抱 着 排斥 的 态度 ， 在 慢 慢 使 用 、 熟 悉 以 后 才 会 逐步 接受 。 


4.2 建立 数据 模型 


4.2.1 存储 数据 的 数据 仓库 


一 个 组 织 内 部 通常 有 许多 信息 系统 ， 不 同 信息 系统 采用 不 同 的 数据 库 ， 
而 且 由 不 同 的 公司 在 不 同 的 时 间 开 发 和 实施 ， 甚 至 可 能 有 不 同 的 版 本 ， 更 
甚 者 中 间 可 能 更 换 过 不 同 的 供应 商 。 

如 果 要 从 整个 组 织 的 角度 来 利用 数据 ， 一 般 需 要 数据 仓库 。 这 种 数据 
仓库 又 称 为 企业 级 数据 仓库 ， 简 称 EDW， 区 分 于 常常 和 数据 集 市 混淆 的 
那 种 数据 仓库 。 

建立 数据 仓库 的 第 一 个 目的 ， 是 把 不 同系 统 的 数据 库 的 不 一 致 性 去 掉 ， 
也 就 是 用 同一 个 数据 库 来 替代 不 同 的 数据 库 。 将 原来 可 能 用 SQL Server、 
Oracle、MySQL 等 不 同 数据 库 保 存 的 数据 ， 保 存 到 一 个 统一 的 关系 数据 库 
中 。 一 般 都 用 普通 的 关系 数据 库 做 数据 仓库 数据 库 ， 比 如 Oracle。 也 有 专 
门 的 数据 仓库 数据 库 ， 比 如 Teradata。 如 果 用 Oracle 作为 数据 仓库 数据 库 ， 
就 必须 把 所 有 的 在 其 他 数据 库 的 数据 统一 到 Oracle 数据 库 中 。 

第 二 个 目的 ， 因 为 不 同 的 数据 库 中 表 和 字段 有 不 同 的 定义 ， 有 些 定义 
数据 库 的 数据 字典 已 不 存在 ， 而 且 时 间 长 了 ， 开 发 人 员 可 能 也 找 不 到 了 ， 
从 而 导致 数据 库 中 数据 再 没有 人 能 看 懂 。 在 这 种 情况 下 ， 如 果 把 数据 移植 
过 来 ， 因 为 数据 仓库 里 数据 定义 比较 一 致 ， 大 家 就 能 看 懂 了 。 

数据 仓库 和 数据 集 市 的 目的 不 一 样 ， 不 是 为 了 最 终 的 查询 ， 而 是 为 了 


要 保存 原始 的 数据 。 

目前 数据 仓库 做 得 比较 好 的 是 银行 。 根 据 银行 监管 部 门 的 要 求 ， 交 易 
数据 必须 保持 三 年 到 五 年 ， 所 以 银行 把 儿 十 个 业务 系统 的 数据 统一 保存 到 
数据 仓库 中 。 银 行 一 般 采 用 Teradata 的 服务 器 和 数据 库 来 建立 数据 仓库 。 

数据 仓库 数据 库 虽然 从 架构 上 来 说 和 关系 数据 库 很 像 ， 但 在 数据 库 设 
计 上 需要 专门 的 模型 ， 保 存 的 数据 包括 数据 是 来 自 哪 个 系统 、 什 么 时 候 抽 
取 过 来 的 等 这 些 数据 来 源 信息 。 即 使 有 些 数 据 信 息 存在 不 一 致 ， 比 如 一 个 
人 有 不 同 的 住址 ， 也 要 保存 原始 数据 ， 以 便 以 后 分 析 时 能 查询 到 这 些 区 别 ， 
需要 时 再 对 这 些 数据 进行 甄别 。 

实际 上 ， 随 着 信息 系统 的 发 展 ， 公 司 的 系统 不 仅 是 多 系统 共存 的 问题 ， 
还 有 替代 的 问题 ， 所 以 历史 数据 的 保存 也 非常 重要 ， 数 据 仓 库 是 保存 历史 
数据 很 好 的 工具 。 

然而 ， 现 在 数据 仓库 的 普及 还 不 够 ， 原 因 除 投资 比较 大 以 外 ， 还 有 就 
是 它 的 价值 还 没有 体现 出 来 。 比 如 银行 的 数据 仓库 ， 更 多 的 基于 数据 备份 
的 目的 ， 并 不 是 支持 用 户 进行 数据 分 析 。Teradata 也 推出 了 探索 式 数据 分 
析 工 具 ， 叫 Aster， 但 它 的 查询 语言 是 SQL 语言 。 就 是 说 ， 必 须 懂 SQL 语 
言 才能 用 Aster， 所 以 使 用 对 象 只 能 是 专业 人 员 ， 而 不 是 一 般 的 业务 人 员 。 
正 是 由 于 直接 应 用 的 缺乏 ， 导 致 大 家 对 数据 仓库 的 建设 不 太 重视 。 

另外 ， 成 本 也 是 一 方面 。 现 在 数据 仓库 硬件 软件 都 是 一 体 化 的 ， 无 疑 
成 本 很 高 。 即 使 是 银行 ， 也 有 成 本 压力 。 现 在 的 Hadoop 等 大 数据 技术 的 
迅猛 发 展 ， 就 是 为 了 解决 这 种 成 本 高 企 的 一 种 替代 方案 。 相 信 随 着 软件 硬 
件 成 本 的 降低 ， 数 据 仓 库 会 得 到 越 来 越 多 的 应 用 。 

图 4-3 是 企业 数据 仓库 的 四 层 模 型 ， 一 般 书 上 只 有 三 层 模 型 ， 把 企业 
数据 仓库 和 数据 集 市 并 列 ， 两 者 只 要 一 个 即 可 。 
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操作 数据 库 附加 的 数据 
图 4-3 企业 数据 仓库 的 四 层 模 型 


4.2.2 可 以 推导 需求 的 维度 模型 


现在 中 国 的 软件 开发 从 哲学 上 来 说 是 经 验 主 义 ， 而 不 是 理性 主义 。 经 
验 主义 完全 根据 客户 的 需求 出 发 ， 客 户 需要 什么 功能 就 开发 什么 功能 。 

在 软件 编程 技术 越 来 越 普及 以 后 ， 软 件 公司 不 去 技术 上 寻求 创新 ， 而 
只 是 关注 行业 经 验 ， 认 为 只 有 掌握 行业 经 验 ， 软 件 才 有 价值 ， 也 就 是 说 ， 
他 们 认为 只 有 凝聚 了 经 验 的 软件 才 有 价值 ， 纯 技术 是 没有 价值 的 。 

鹰 眼 技术 的 核心 是 维度 模型 。 从 使 用 角度 来 看 ， 采 取 从 小 数据 看 大 数 
据 ， 然 后 逐 级 钻 取 的 方式 ， 从 一 个 数据 的 合计 开始 ， 按 照 一 个 预先 定义 的 
层次 结构 逐 级 钻 取 到 最 细 的 一 级 ， 直 到 钻 透 到 明细 数据 。 钻 取 时 采用 可 视 
化 方式 ， 每 个 小 数据 都 不 是 以 数字 的 方式 ， 而 是 以 可 视 化 的 方式 来 显示 。 
钻 取 的 工作 也 在 可 视 的 图 形 化 上 交互 式 进行 ， 符 合 人 们 的 使 用 习惯 。 

虽然 维度 模型 出 现 以 后 ， 很 多 人 也 在 使 用 ， 但 可 能 更 多 局 限 在 OLAP 
建 模 的 时 候 。 只 在 建 模 的 时 候 用 到 它 ， 在 展示 数据 时 就 丢弃 了 。 鹰 眼 技术 


的 主要 特征 是 维度 模型 的 使 用 贯穿 数据 仓库 数据 库 的 建立 、OLAP 建 模 及 
最 后 交互 式 可 视 化 的 界面 设计 全 过 程 。 

使 用 维度 模型 ， 关 键 的 是 把 它 作 为 人 们 认识 和 使 用 数据 的 一 种 方法 ， 
而 且 是 一 种 通用 的 方法 ， 并 不 受 人 们 经 验 的 影响 。 也 许 从 经 验 的 角度 来 说 可 
以 对 这 个 模型 进行 微调 ， 做 一 些 取舍 ， 但 总 的 架构 应 该 完全 基于 这 个 模型 。 

当 用 户 面 对 这 个 模型 ， 开 始 时 会 非常 不 适应 。 因 为 它 明显 的 是 一 个 过 
度 设计 的 产物 ， 许 多 功能 超出 了 人 们 的 想象 。 一 般 来 说 ， 软 件 的 用 户 希望 
根据 自己 的 认识 水 平 来 逐渐 增加 软件 功能 ， 一 下 子 接受 很 多 的 功能 的 话 会 
非常 不 适应 。 但 这 种 设计 却 能 够 满足 用 户 的 许多 需求 ， 包 括 现 在 的 需求 和 
未 来 的 需求 ， 他 们 的 需求 一 般 很 难 超越 模型 覆盖 的 范围 。 

用 户 的 需求 在 不 断 的 变化 之 中 ， 可 以 分 为 现在 的 需求 和 潜在 的 需求 。 
潜在 的 需求 现在 还 没 遇 到 ， 所 以 用 户 也 说 不 出 来 。 还 有 的 需求 是 已 经 有 这 
个 意识 ， 但 无 法 描述 出 来 。 在 做 用 户 需 求 调研 的 时 候 ， 用 户 仅仅 能 说 出 现 
在 意识 到 的 ， 并 且 可 以 描述 的 需求 。 这 就 是 许多 定制 软件 在 客户 使 用 之 后 
总 是 需要 修改 的 原因 ， 特 别 是 在 做 报表 时 ， 问 题 更 为 明显 。 报 表 实 际 上 是 
决策 支持 系统 的 一 部 分 ， 因 为 使 用 报表 的 时 候 常常 会 遇 到 一 些 不 确定 的 需 
求 ， 在 做 需求 调研 的 时 候 ， 用 户 只 说 出 了 部 分 需求 ， 而 在 实际 使 用 的 时 候 ， 
他 们 又 会 觉得 报表 不 能 满足 要 求 ， 而 软件 开发 者 觉得 客户 的 需求 变化 太 大 ， 
无 法 把 握 。 

现在 很 多 的 软件 公司 的 解决 方案 是 提供 一 个 报表 的 自助 设计 工具 。 你 
需要 什么 报表 ， 自 己 去 定义 。 但 是 ， 一 个 报表 工具 的 使 用 也 不 是 简单 的 事 ， 
需要 专人 去 学 习 使 用 ， 而 且 报表 使 用 者 和 开发 者 也 不 是 一 个 人 ， 只 是 把 供 
需 矛 盾 从 软件 开发 公司 转移 到 企业 内 部 的 开发 人 员 ， 并 没有 真正 解决 问题 。 
报表 真正 的 使 用 者 可 能 是 一 些 领导 层 或 者 是 业务 部 门 的 负责 人 ， 他 们 在 有 
需求 的 时 候 会 交代 技术 人 员 去 开发 ， 而 对 技术 人 员 来 说 ， 他 的 需求 也 是 不 
确定 的 ， 可 能 今天 要 这 个 数据 ， 明 天 又 要 那个 数据 。 出 现 这 个 情况 的 主要 
原因 是 客户 描述 的 需求 只 是 总 需求 的 一 部 分 ， 类 似 它 的 一 个 子 集 ， 而 客户 
实际 的 需求 虽然 有 一 部 分 会 在 这 个 子 集 内 ， 但 常常 会 超出 这 个 子 集 。 这 个 
需求 不 确定 问题 在 报表 系统 开发 中 是 一 个 常态 ， 如 何 应 对 呢 ? 座 眼 技术 是 
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采用 的 一 种 基于 理性 主义 的 、 基 于 模型 的 推导 ， 它 不 受 客户 目前 需求 的 限 
制 ， 可 以 推导 出 几乎 所 有 的 需求 ， 为 谨慎 起 见 ， 我 们 的 说 法 是 一 80% 的 
需求 。 或 者 从 另外 的 角度 来 说 ， 对 客户 是 过 度 设计 和 过 度 服务 ， 从 表面 上 
来 看 远 远 超出 现 有 的 需要 。 只 有 这 样 才能 满足 客户 。 


4.2.3 维度 模型 原理 


在 传统 数据 库 中 数据 检索 技术 已 经 非常 成 熟 。 

数据 检索 就 是 给 定 一 个 或 一 组 条 件 ， 找 出 满足 条 件 的 数据 子 集 。 检 索 
条 件 对 应 数据 库 中 数据 表 及 表 中 某 个 或 者 某 几 个 字段 的 值 。 比 如 显示 一 份 
上 海 市 年 龄 大 于 80 岁 人 员 的 名 单 ， 就 是 一 个 简单 的 检索 功能 。 

如 果 有 这 么 一 个 需求 ， 要 求 显示 上 海 市 80 岁 以 上 年 龄 老人 的 平均 收 
入 或 者 是 平均 医疗 费用 ， 这 种 数据 就 属于 数据 统计 。 如 果 用 普通 关系 数据 
库 去 统计 的 话 ， 速 度 会 比较 慢 。 

为 提高 计算 平均 数 或 者 合计 数 的 速度 ， 常 常 采用 一 个 叫 轻 度 汇总 方法 ， 
也 就 是 把 可 能 需要 的 统计 数据 预先 计算 好 ， 比 如 说 在 晚上 进行 计算 ， 然 后 
把 它 保存 在 另 一 个 数据 表 中 ， 这 样 如 果 需 要 查询 的 话 ， 就 不 需要 从 原始 数 
据 表 中 读 取 数 据 再 计算 ， 而 是 直接 从 轻 度 汇总 表 中 查 出 计算 结果 ， 从 而 大 
大 提高 数据 统计 的 速度 。 

但 是 ， 轻 度 汇总 的 问题 在 于 难以 满足 使 用 者 的 各 种 需求 。 因 为 你 可 能 
按 几 种 条 件 组 合 去 预先 汇总 ， 而 他 可 能 正好 查询 的 是 你 汇总 之 外 的 一 组 条 
件 。 比 如 说 ， 按 照 80 岁 以 上 年 度 收入 合计 做 了 预计 算 ， 但 70 岁 到 80 岁 
的 月 收入 平均 值 没有 预计 算 ， 这 样 前 面 一 个 条 件 速度 很 快 ， 查 后 面 一 个 条 
件 速度 就 会 很 慢 。 如 果 你 想 把 它 所 有 的 条 件 组 合 都 汇总 ， 但 这 些 条 件 组 合 
会 很 多 ， 比 如 说 ， 汇 总 是 按 年 度 汇 总 ， 还 是 季度 汇总 、 月 度 汇 总 、 日 汇总 。 
汇总 条 件 组 合 太 少 ， 查 询 命中 率 就 很 低 。 但 如 果 都 汇总 的 话 ， 由 于 组 合 会 
非常 多 ,会 出 现 所 谓 的 “ 维 灾难 ”， 根 本 无 法 做 到 。 

另外 ， 汇 总 计算 需要 的 时 间 非 常 多 ， 晚 上 可 能 由 于 数据 太 多 ， 没 有 足 
够 时 间 去 计算 ， 可 能 到 了 天 亮 还 没有 汇总 完 。 如 果 一 个 月 汇总 一 次 ， 那 么 





数据 更 新 过 后 ， 汇 总 数 会 来 不 及 更 新 。 还 有 一 个 问题 ， 就 是 每 个 汇总 都 会 
占 一 定 的 硬盘 空间 ， 这 么 多 汇总 硬盘 是 否 能 放 得 下 。 

很 多 计算 机 专家 实际 上 早 就 已 经 研究 过 这 个 问题 ， 是 商业 智能 或 数据 
挖掘 领域 的 一 个 课题 。 对 于 这 类 需求 ， 需 要 建立 数据 模型 ， 这 个 模型 叫 维 
度 模型 或 星 型 模型 , 由 OLAP Server 去 处 理 。 虽 然 这 方面 技术 已 经 比较 成 熟 ， 
主要 的 数据 库 软件 公司 比如 微软 、Oracle 都 有 相应 的 软件 产品 ， 但 实际 应 
用 还 不 太 多 。 

这 个 技术 的 研究 高 潮 应 该 在 2000 年 左右 ， 但 现在 掌握 并 运用 这 个 模 
型 的 人 很 少 ， 有 两 个 原因 : 第 一 个 原因 是 这 个 模型 相对 来 说 比较 难 ， 属 于 
一 个 专业 领域 ， 除 非 专业 从 事 商 业 智能 开发 的 技术 人 员 ， 一 般 软件 开发 人 
员 不 掌握 。 第 二 个 原因 就 是 商业 智能 技术 到 现在 成 功 应 用 的 还 很 少 ， 从 表 
面 上 来 看 是 由 于 技术 要 求 高 、 成 本 高 ， 很 多 企业 用 不 起 ， 实 质 上 是 它 的 失 
败 率 很 高 。 就 是 说 ， 即 使 花 了 很 多 钱 做 了 BI 的 企业 ， 大 多 并 没有 达到 它 
预期 的 目标 。 所 以 这 个 技术 口碑 不 太 好 ， 推 广 成 本 很 高 。 

BI 项 目 实施 满意 度 低 的 主要 原因 在 于 对 需求 的 把 握 。 它 还 是 按照 传统 
的 信息 系统 的 开发 模式 ， 需 要 客户 单位 提供 详细 需求 。 客 户 单位 提 不 出 需 
求 ， 或 者 即使 勉强 提出 需求 ， 需 求 又 会 经 常 发 生变 化 ， 最 终 导致 按 预 定 需 
求 开 发 的 软件 不 能 满足 后 面 的 需求 变动 ， 从 而 导致 客户 的 满意 度 下 降 ， 最 
后 导致 了 推广 不 力 。 有 关 如 何 满足 客户 需求 不 确定 的 问题 ， 在 本 书 其 他 章 
节 里 有 详细 的 描述 。 

那么 维度 模型 的 核心 是 什么 呢 ? 

现在 的 数据 很 多 ， 不 同 单位 信息 系统 的 数据 格式 都 不 尽 相同 ， 用 户 对 
于 数据 查询 的 要 求 也 不 同 。 

表面 上 看 ，BI 面 对 的 需求 是 比较 混乱 的 ， 难 以 找 出 规律 。 这 个 非常 类 
似 牛 顿 在 发 现 万 有 引力 定律 之 前 ， 人 们 对 看 到 的 很 多 自然 现象 难以 理解 : 
为 什么 扔 下 一 个 东西 不 会 飞 到 天 上 而 是 掉 到 地 上 。 在 牛顿 的 万 有 引力 定律 
发 现 以 后 ， 人 们 会 发 现实 际 上 所 有 东西 的 运动 都 受 万 有 引力 定律 的 限制 ， 
这 样 就 很 好 地 解释 了 世间 各 种 各 样 的 现象 。 

同样 ， 维 度 模 型 也 是 找到 了 数据 检索 的 规律 ， 从 而 把 看 似 没有 规律 的 
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需求 归结 为 一 个 统一 的 模型 。 客 户 需求 的 规律 就 隐藏 在 维度 模型 中 ， 只 要 
按照 维度 模型 对 数据 进行 处 理 ， 用 户 的 需求 一 般 都 能 满足 。 

这 个 维度 模型 把 数据 分 为 两 类 : 一 种 数据 叫 维度 数据 ; 另 一 种 数据 叫 
度量 数据 ,维度 数据 常常 是 文字 、 日 期 类 型 , 比如 说 客户 名 称 或 者 销售 日 期 ， 
事实 表 数 据 都 是 一 些 数 值 类 型 ， 比 如 销售 数量 或 销售 金额 。 用 维度 数据 做 
查询 条 件 ， 一 般 来 说 不 会 跳出 维度 表 范围 ， 对 事实 表 里 面 的 数据 可 以 进行 
汇总 ， 比 如 说 算 合计 、 平 均值 、 最 大 值 和 最 小 值 等 ， 这 种 数值 表 中 的 数值 
数据 又 称 为 度量 值 。 

数据 的 查询 是 非常 复杂 的 ， 为 了 对 应 这 种 复杂 性 ， 维 度 表 需 要 进一步 
的 划分 ， 划 分 成 层次 结构 。 比 如 ， 日 期 是 一 个 维度 ， 包 括 年 、 月 、 日 等 ， 
把 这 些 数据 库 生 成 一 个 层次 结构 ， 这 个 层次 结构 里 面 含 年 、 月 、 日 三 层 ， 
有 了 层次 结构 后 ， 可 以 把 日 的 数据 自动 汇总 为 月 的 数据 ， 月 的 数据 汇总 为 
年 的 数据 。 每 个 层次 结构 里 面包 括 多 个 级 别 ， 一 个 完整 日 期 层次 结构 的 级 
别 可 以 包括 年 、 季 、 月 、 旬 、 日 。 

在 国外 还 有 财政 年 度 ， 有 日 历年 度 的 年 和 财政 年 度 的 年 的 区 分 ， 同 样 
月 也 有 也 有 财政 年 度 的 月 和 日 历 月 度 的 月 的 区 分 。 在 国内 设计 日 期 维度 一 
般 有 两 个 层次 结构 就 可 以 了 ， 第 一 个 层次 结构 叫 年 、 季 、 月 、 日 ; 第 二 个 
是 年 、 周 、 日 ， 大 家 知道 周 和 月 是 不 可 以 同时 存在 的 ， 所 以 必须 分 成 两 个 
层次 结构 。 客 户 查 询 数据 不 是 按 年 查 就 是 按 月 查 ， 不 是 按 月 查 就 是 按 季 查 ， 
或 者 按 周 查 ， 反 正 查 询 不 会 突破 这 两 个 层次 结构 。 只 要 按 这 两 个 结构 进行 
数据 处 理 ， 实 际 上 也 是 一 种 轻 度 汇总 ， 客 户 的 需求 难以 逃 出 这 个 范围 。 

当然 还 有 一 些 需求 ， 对 任意 日 到 任意 日 之 间 的 数据 进行 统计 。 这 种 设 
计 对 客户 有 一 定 的 吸引 力 但 实际 用 处 不 大 ， 是 一 种 偷懒 的 做 法 ， 以 为 这 样 
就 不 要 去 研究 客户 的 需求 了 。 虽 然 客户 会 有 这 方面 的 需求 ， 但 实际 用 途 不 
是 很 大 ， 因 为 在 做 统计 分 析 时 有 一 个 很 重要 的 功能 就 是 做 同比 分 析 。 同 比 
一 般 是 按 月 进行 同比 ， 或 者 是 按 日 、 季 进行 同比 ， 像 这 种 按 任意 时 间 段 进 
行 同 比 是 没有 任何 意义 的 。 

对 照 研 究 一 下 财务 报表 。 我 们 知道 财务 报表 最 小 是 月 报 ， 没 有 哪个 财 
务 报 表 做 的 是 2 月 5 日 一 3 月 4 日 的 报表 。 虽 然 国 外 的 财政 年 度 可 以 从 任 





何 一 个 月 (比如 4 月 ) 开始， 从 当年 的 4 月 1 日 到 下 一 年 的 3 月 31 日 ， 
但 这 是 一 个 年 度 的 定义 ， 不 是 一 个 任意 时 间 段 的 定义 。 为 什么 财务 不 会 要 
求 有 任意 时 间 段 的 报告 ， 而 计算 机 软件 的 检索 会 要 任意 时 间 段 ， 唯 一 的 解 
释 就 是 财务 报表 已 经 成 熟 了 ， 大 家 已 经 习惯 了 规范 化 的 时 间 范 围 ， 而 数据 
统计 还 不 太 规 范 。 

通常 统计 或 检索 的 软件 开发 人 员 不 知道 维度 模型 ， 也 没有 按照 年 月 对 
数据 做 特殊 处 理 。 把 数据 按照 时 间 维度 显示 时 ， 会 同时 显示 每 个 月 的 数据 ， 
就 是 同时 显示 一 年 中 多 个 月 的 数据 ， 在 这 种 情况 下 ， 任 意 日 就 无 法 使 用 ， 
除非 为 每 个 日 期 定义 一 个 层次 结构 ， 而 这 是 不 现实 的 。 

在 定义 维度 时 ， 一 个 数据 表 中 有 很 多 维度 ， 一 般 包含 度量 数据 的 事实 
表 都 对 应 多 个 维度 ， 比 如 在 销售 订单 表 中 ， 可 能 有 时 间 、 客 户 、 存 货 、 业 
务 员 等 维度 ， 所 以 就 像 一 个 事实 表 周 围 围 绕 着 多 个 维度 表 ， 画 出 一 个 像 星 
星 一 样 的 图 来 ， 这 也 是 维度 模型 称 为 星 型 模型 的 原因 。 

如 果 一 个 数据 表 中 有 100 个 字段 ， 是 不 是 就 有 100 个 维度 呢 ? 一 般 会 
考虑 把 文字 、 时 间 类 型 字段 当成 维度 ， 把 数值 型 的 当成 度量 值 。 不 是 每 个 
字段 都 是 一 个 独立 维度 ， 而 是 一 个 维度 有 多 个 层次 结构 ， 一 个 层次 结构 涉 
及 多 个 字段 。 

此 外 ， 有 些 字段 数据 值 不 完整 ， 在 很 多 记录 中 为 NULL 值 ， 不 需要 建 
成 维度 。 有 些 数 值 比较 少 的 字段 ， 可 以 转换 成 度量 值 而 不 做 维度 ， 如 性 别 
字段 ， 男 女 一 般 用 文字 表示 ， 如 果 做 成 维度 的 话 维度 数量 太 多 ， 一 般 就 做 
成 一 个 度量 值 ， 改 成 一 个 是 否 男性 的 度量 值 一 -男性 值 为 1， 女 性 值 为 0， 
这 样 也 方便 统计 男性 和 女性 的 数量 。 

在 星 型 模式 建 好 后 ， 可 以 看 到 许多 的 维度 ， 每 个 维度 上 有 不 同 的 层次 ， 
如 果 把 它 做 成 图 形 ， 就 像 一 个 雷达 图 ， 从 中 心 放 射出 许多 的 维度 ， 每 个 维 
度 上 有 很 多 的 节点 分 别 代表 层次 结构 的 级 别 ， 时 间 维 度 的 层次 结构 有 年 、 
季 、 月、 日 节点 。 地 区 维度 有 省 、 市 、 县 、 区 节点 , 产品 维度 有 大 类 、 小 类 、 
产品 的 节点 。 

用 雷达 图 看 多 维 数据 模型 ， 任 何 一 次 查询 实际 上 是 每 个 维度 中 的 一 个 
节点 连 起 来 形成 的 一 个 多 边 形 。 考 虑 到 这 种 组 合 非常 之 多 ， 不 可 能 把 所 有 
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组 合 的 数据 预先 聚合 在 一 起 。 在 开发 OLAP 系统 时 ， 科 学 家 研究 一 些 算法 ， 
其 中 之 一 就 是 提出 一 个 叫 “ 冰 山 立 方 体 ” 的 概念 ， 只 把 最 主要 的 几 个 组 合 
进行 预计 算 。 就 像 冰 山 一 样 ， 大 量 的 维度 组 合 在 冰山 的 水 下 面 ， 露 出 一 部 
分 做 预计 算 ， 或 者 叫 预先 聚合 。 还 有 个 算法 叫 “ 外 壳 立 方 体 ”， 把 立方 体 
外 壳 部 分 的 维度 组 合 做 成 预先 计算 ， 其 他 的 待 查询 的 时 候 遇 到 再 做 计算 。 

在 OLAP 系统 中 ， 预 计算 可 以 设置 ， 从 时 间 和 空间 两 个 因素 进行 平衡 。 
要 加 快 查询 速度 ， 减 少 查 询 时 间 ， 需 要 牺牲 一 些 空间 ， 多 做 一 些 预计 算 。 
如 果 想 节约 空间 ， 可 以 忍受 一 些 等 待 时 间 ， 那 么 可 以 调 到 空间 最 小 化 。 

当 维 度 的 组 合 在 预计 算 的 范围 之 内 时 ， 统 计 速 度 就 非常 快 ， 在 范围 之 
外 统计 速度 就 比较 慢 。 但 是 ， 还 有 一 个 缓冲 设计 ， 就 是 说 你 只 要 查 过 一 次 
以 后 ， 计 算 结果 就 被 保存 下 来 ， 速 度 就 比较 快 。 

为 了 及 时 更 新 数据 ， 一 般 安 排 在 当天 下 班 时 间 ， 比 如 说 晚上 8 点 到 次 
日 凌晨 8 点 之 间 ， 选 一 个 时 间 段 做 增 量 的 数据 抽取 ， 把 来 自 数据 源 中 一 天 
增加 的 数据 抽取 过 来 ， 放 到 数据 仓库 的 数据 库 里 。OLAP 的 服务 器 从 数据 
仓库 服务 器 里 抽取 增 量 数据 加 在 原来 的 立方 体 上 ， 按 照 原来 设计 的 规则 对 
部 分 数据 进行 预计 算 ， 第 二 天 查询 时 ， 就 会 看 到 包括 昨天 数据 在 内 新 的 统 
计 结 果 。 

不 同 的 软件 公司 有 不 同 的 OLAP 服务 器 ， 如 微软 公司 的 SQL Server 
Analysis Services (SSAS) ，Oracle 公司 有 两 个 产品 ， 一 个 叫 OLAP Server， 
另 一 个 叫 Essbase OLAP Server。 

对 OLAP Server 访问 目前 有 两 种 访问 方式 : 一 种 访问 方式 是 对 SQL 进 
行 了 一 些 扩充 ， 如 Oracle; 还 有 一 种 是 微软 提出 的 MDX 语言 。MDX 是 一 
个 专用 的 多 维 数 据 查 询 , 效率 比 SQL 高 , 在 执行 时 会 自动 转换 成 SQL 语言 ， 
比如 有 一 个 MDX 语句 会 转换 18 个 SQL 语言 执行 ， 因 此 ， 它 是 一 个 适合 
数据 分 析 的 综合 性 查询 。Oracle 里 面 的 SQL 实际 上 是 模仿 了 SQL 的 格式 ， 
查询 命令 还 会 传递 给 OLAP Server。OLAP Server 表面 上 看 好 像 由 许多 视 
图 组 成 ， 实 际 上 这 个 视图 和 一 般 的 数据 库 的 视图 不 一 样 ， 是 OLAP 立方 
体 的 对 外 接口 。 好 像 访 问 OLAP Sevrer 是 对 视图 进行 查询 ， 实 际 上 会 转 
换 成 OLAP Server 内 部 的 命令 ， 也 就 是 一 个 查询 会 在 内 部 转换 成 很 多 的 


SQL 命令 。 

通过 这 两 种 OLAP Server 访问 语言 ， 可 以 像 一 般 程序 一 样 进行 编程 ， 
或 者 可 以 在 Excel 里 面 直接 输入 MDX 或 SQL 命令 ， 从 OLAP Server 里 面 
提取 数据 。 这 个 数据 和 一 般 数据 库 的 数据 不 同 ， 它 是 一 些 汇总 数据 ， 但 比 
从 关系 数据 库 直接 统计 要 快 得 多 。 

OLAP Server 实际 上 有 三 种 设计 : 一 种 叫 ROLAP， 是 关系 OLAP; 另 
一 种 叫 MOLAP， 是 多 维 OLAP; 还 有 一 种 叫 HOLAP， 是 混合 OLAP。 区 
别 在 于 是 否 把 聚合 数据 放 到 OLAP Server 里 面 去 ， 也 就 是 有 没有 预计 算 的 
功能 。 

MOLAP 是 多 维 OLAP， 是 一 种 典型 的 OLAP， 它 的 做 法 就 是 把 数据 
仓库 的 聚合 数据 都 放 到 OLAP Server 里 面 去 ， 所 以 速度 是 比较 快 的 ， 是 现 
在 最 常用 的 OLAP 类 型 。 

ROLAP 并 没有 对 数据 做 聚合 ， 还 是 把 数据 放 在 数据 仓库 服务 器 中 ， 
只 是 提供 了 一 个 OLAP 的 访问 接口 。 如 果 用 MDX 语句 查 ROLAP Server 
的 话 ， 它 的 做 法 是 首先 把 MDX 语句 转换 成 SQL 语句 ， 然 后 分 别 执行 SQL 
语句 ， 在 数据 仓库 所 在 的 关系 数据 库 做 计算 ， 把 结果 整合 后 反馈 。 如 果 关 
系数 据 库 是 普通 数据 库 ，ROLAP 的 访问 速度 比较 慢 ， 所 以 ROLAP 有 一 段 
时 间 基 本 被 抛弃 了 ， 直 到 出 现 SAP HANA 这 样 的 内 存 数 据 库 。 

微软 的 SSAS 三 种 OLAP 都 支持 ，Oracle 的 OLAP Server 根本 不 支持 
ROLAP， 开 源 软 Mondrian 支持 ROLAP。 

现在 关系 数据 库 新 的 发 展 趋势 是 内 存 计算 ， 像 SAP 的 Hana。 内 存 计 
算 虽 然 是 关系 数据 库 的 架构 ， 但 把 数据 放 在 内 存 中 ， 随 机 访问 速度 非常 快 。 

内 存 数据 库 访 问 速度 快 的 原因 是 解决 了 两 个 问题 。 一 个 问题 是 硬盘 中 
数据 读 取 速 度 比较 慢 ， 在 内 存 中 读 取 数 据 要 比 硬盘 快 得 多 ; 还 有 一 个 问题 
是 去 掉 数 据 缓存 。 

在 关系 数据 库 里 面 ， 为 了 解决 内 存 数 据 和 硬盘 数据 之 间 的 读 取 速 度 不 
同 ， 有 个 缓存 命中 机 制 ， 在 读数 据 的 时 候 会 判断 数据 是 在 内 存 中 还 是 在 硬 
盘 中 ， 然 后 再 返回 数据 。 如 果 数 据 在 内 存 中 就 会 很 快 ， 内 存 中 没有 就 会 从 
硬盘 中 读 。 内 存 比较 满 ， 数 据 很 久 不 用 的 话 会 置换 到 硬盘 中 。 这 种 转换 会 
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耗费 服务 器 资源 。 

有 了 内 存 数据 库 以 后 ，ROLAP 可 以 发 挥 作用 。 虽 然 执 行 十 几 个 的 
SQL， 但 由 于 速度 很 快 ， 效 率 会 很 高 。ROLAP 带 来 的 最 大 优点 是 数据 可 以 
实时 统计 ， 也 就 是 说 把 数据 从 数据 源 里 面 提 取 到 数据 仓库 服务 器 中 ， 马 上 
就 可 以 查询 了 ， 不 需要 晚上 做 预 处 理 。 当 天 的 数据 当天 就 可 以 统计 ， 还 是 
比较 有 吸引 力 的 。 当 然 ， 这 里 有 一 个 前 提 ， 就 是 业务 系统 必须 用 了 内 存 数 
据 库 , 但 现在 很 多 软件 还 没 用 内 存 数据 库 。SAP ERP 已 经 移 到 SAP Hana 上 ， 
做 OLAP 就 可 以 用 到 内 存 数据 库 。 


4.2.4 分 主题 进行 数据 分 析 


在 做 数据 分 析 中 ， 常 常会 把 数据 分 析 的 目标 分 成 不 同 主题 。 各 主题 独 
立 存在 。 从 应 用 角度 来 看 ， 一 个 主题 面向 独立 一 个 目标 ， 如 销售 和 采购 就 
是 两 个 不 同 的 主题 。 从 分 析 的 数据 指标 来 看 ， 把 一 批 相 关 指 标 放 在 一 起 作 
为 一 个 主题 进行 分 析 ， 将 其 他 的 指标 分 为 另外 的 主题 。 比 如 ， 产 品 销售 有 
产品 合同 的 数据 、 订 单 的 数据 、 发 货 的 数据 和 仓库 出 库 的 数据 ， 这 些 都 可 
作为 一 组 数据 放 在 同一 个 主题 中 。 而 销售 订单 的 数据 和 采购 订单 的 数据 关 
系 不 大 ， 就 必须 放 在 两 个 主题 中 分 别 进 行 分 析 。 

主题 可 以 用 于 对 权限 的 控制 ， 例 如 销售 人 员 只 能 看 销售 的 数据 分 析 ， 
因此 只 有 销售 分 析 主 题 的 权限 ， 其 他 数据 放 在 其 他 主题 中 他 是 看 不 到 的 
这 样 就 起 到 保密 和 信息 安全 的 作用 。 

主题 的 划分 也 可 以 从 数据 的 维度 角度 进行 。 一 般 来 说 ， 同 一 个 主题 中 
的 数据 具有 相同 的 维度 。 例 如 在 销售 中 ， 有 个 重要 的 维度 就 是 客户 ， 因 此 
跟 客 户 有 关 的 指标 一 般 都 应 放 在 销售 数据 分 析 主 题 中 。 如 果 指 标 和 供应 商 
有 关 ， 那 么 显然 不 能 放 在 销售 数据 分 析 主 题 中 ， 而 只 能 放 在 采购 数据 分 析 
主题 中 。 

另外 ， 主 题 的 确定 还 跟 维度 的 多 少 有 关 。 销 售 和 业务 员 挂钩 ， 所 以 有 
部 分 的 销售 数据 会 与 业务 员 有 关 。 但 是 ， 还 有 其 他 与 销售 相关 的 数据 ， 
比如 说 应 收 款 。 应 收 款 数 据 只 跟 客 户 有 关 而 跟 业 务 员 无 关 ， 即 应 收 款 的 数 





据 比 销售 的 数据 要 少 一 个 维度 。 在 这 种 情况 下 ， 需 要 单独 建立 一 个 主题 ， 
而 不 是 把 应 收 款 放 在 销售 数据 分 析 主 题 中 ， 因 为 应 收 款 还 有 一 个 付款 方式 
的 维度 ， 而 这 个 维度 跟 销售 没有 关系 。 这 种 维度 不 同 且 维度 个 数 不 一 样 的 
数据 ， 很 明显 不 能 放 在 同一 个 主题 中 。 

当 遇 到 较 大 主题 时 ， 原 则 上 不 予 拆 分 。 主 题 的 拆 分 不 是 根据 数据 指标 
的 多 少 来 确定 的 ， 而 是 由 跟 它 相关 维度 来 确定 。 放 在 一 个 主题 中 的 数据 更 
便于 比较 ， 因 为 数据 只 有 通过 可 视 化 进行 比较 才能 产生 价值 。 若 是 按照 数 
量 拆 分 ， 有 很 多 可 相 比 的 数据 不 能 放 在 一 个 屏幕 上 ， 不 能 相互 参照 ， 对 决 
策 的 意义 就 小 许多 。 


4.2.5 离 不 开 的 时 间 维度 


在 数据 分 析 中 有 一 个 很 重要 的 维度 就 是 时 间 维 度 。 时 间 维 度 的 重要 性 
在 于 ， 无 论 在 哪 一 个 数据 分 析 主 题 中 它 都 是 必须 具备 的 维度 。 换 言 之 ， 数 
据 分 析 非 常 重视 历史 数据 ， 若 只 有 当前 数据 而 没有 历史 数据 ， 那 么 数据 分 
析 是 不 成 立 的 。 

时 间 维 度 一 般 可 以 分 为 两 种 层次 结构 : 一 为 年 、 季 、 月 、 旬 、 日， 这 
是 一 个 比较 完整 的 时 间 维度 ; 二 为 年 、 周 、 日 。 众 所 周知 ， 周 和 月 不 重 登 ， 
所 以 不 能 放 在 同一 个 层次 结构 中 。 一 般 采 用 是 经 过 简化 后 的 层次 结构 : 年 、 
月 , 日 。 

时 间 维 度 准确 地 说 是 日 期 维度 ， 实 际 上 只 考虑 日 期 ， 没 有 考虑 时 间 ， 
如 果 在 工业 控制 的 数据 分 析 中 ， 需 要 另外 建立 一 个 24 小 时 的 时 间 维 度 。 

时 间 维 度 具有 很 大 的 作用 ， 因 为 很 多 的 指标 都 与 时 间 有 关 ， 有 些 常用 
的 计算 指标 ， 例 如 同比 、 环 比 、 年 初 至 今 及 月 初 至 今 ， 都 和 时 间 有 关 。 

时 间 维 度 的 数据 ， 一 般 都 是 合计 数 : 年 度 合计 数 、 月 度 合 计数 和 日 期 
合计 数 。 在 这 里 面 ， 日 期 的 合计 值 加 起 来 等 于 月 度 合计 值 ， 月 度 合 计 值 加 
起 来 等 于 年 度 合计 值 。 可 以 通过 数据 向 下 钼 取 ， 从 任意 一 年 看 到 任意 一 月 ， 
再 看 到 任意 一 天 合计 数 。 反 过 来 , 通过 上 卷 ( 向 上 钻 取 ) 也 可 以 从 日 看 到 月 ， 
再 看 到 年 的 合计 数 。 
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一 个 概要 页 面 中 ,会 有 一 个 年 度 至 今 的 数据 指标 。 因 为 做 一 个 仪表 板 ， 
常常 要 看 看 当年 年 初 到 统计 时 为 止 的 合计 销售 额 ， 即 从 当年 1 月 1 日 开始 
到 当天 的 合计 值 。 

中 国 的 会 计 年 度 自 公历 1 月 1 日 起 至 12 月 31 日 止 , 但 有 的 国家 是 从 
每 年 的 6 月 1 日 到 第 二 年 的 5 月 31 日 以 及 从 每 年 的 9 月 1 日 到 第 二 年 
的 8 月 31 日 等 。 因此， 时 间 维 度 又 多 了 一 种 定义 ， 即 财政 时 间 维 度 ， 相 
对 的 日 历时 间 维 度 。 在 数据 分 析 时 ， 需 要 分 别 对 这 两 个 维度 进行 分 析 。 

时 间 维 度 表示 的 是 历史 的 趋势 ， 一 般 用 折线 图 表示 。 和 利润、 收入 这 些 
可 以 合计 的 数据 指标 可 以 采用 面积 图 。 

在 一 般 的 软件 开发 中 ， 为 了 既 简化 设计 ， 又 能 满足 任意 需求 ， 在 查询 
或 报表 中 ， 只 要 涉及 时 间 条 件 的， 一 般 采 用 可 以 同时 输入 开始 时 间 和 结束 
时 间 。 因 而 ， 很 多 人 在 数据 分 析 中 也 希望 有 这 样 的 功能 。 

在 事务 软件 开发 中 ， 由 于 不 需要 考虑 层次 结构 ， 所 以 输入 任意 开始 时 
间 和 结束 时 间 是 一 种 比较 省 力 的 实现 方式 ， 实 际 上 是 对 时 间 的 查询 需求 没 
有 细 化 。 而 在 数据 分 析 处 理 中 ， 一 般 不 支持 这 种 处 理 。 数 据 分 析 建 模 中， 
需要 按照 预先 定义 的 维度 进行 预 处 理 。 随 意 输 入 的 开始 时 间 和 结束 时 间 无 
法 进行 预 处 理 。 由 于 分 析 需 要 进行 同比 、 环 比 计算 ， 任 意 时 间 段 的 处 理 也 
无 法 计算 同比 环比 ， 即 使 有 也 没有 任何 意义 ， 因 为 一 般 都 讲 5 月 环比 增长 ， 
不 会 讲 5 月 10 日 到 5 月 21 日 的 环比 。 

随 着 数据 分 析 的 深入 应 用 ， 人 们 也 会 逐渐 接受 按照 固定 的 时 间 进 行 分 
析 的 习惯 。 实 际 上 ， 在 微软 开发 的 多 维 查 询 语言 MDX 中 ， 如 果 不 考虑 数 
据 查询 的 时 间 ， 或 者 在 数据 集 比较 小 的 情况 ， 它 的 任意 时 间 段 查询 是 可 以 
实现 的 ， 但 计算 查询 相关 的 同比 、 环 比分 析 就 会 比较 困难 ， 且 不 利于 大 家 
共享 分 析 结 果 。 


4.2.6 通过 时 间 分 析 数 据 


时 间 维 度 是 数据 分 析 中 最 主要 的 一 个 维度 ， 每 一 个 数据 都 应 该 有 时 间 
维度 。 时 间 维 度 表示 的 是 数据 的 历史 信息 ， 历 史 信 息 里 保存 了 非常 多 可 以 


分 析 的 迹象 ， 从 中 可 以 发 现 很 多 的 问题 。 

一 般 来 说 ， 在 时 间 维 度 都 是 用 折线 图 来 表示 ， 因 为 折线 图 表示 的 是 连 
续 的 意思 ， 在 一 定 的 时 间 内 变化 不 大 ， 而 且 有 一 定 的 关系 ， 所 以 用 折线 图 
把 不 同时 间 点 的 数据 连 起 来 可 以 看 到 变化 趋势 。 还 有 一 些 值 可 以 用 面积 图 
来 表示 。 面 积 图 可 以 表示 出 这 段 时 间 之 内 的 总 数 ， 比 如 说 销售 额 ， 如 果 用 
一 年 12 个 月 销售 额 的 面积 加 起 来 应 该 就 是 全 年 的 销售 额 。 有 些 数据 之 和 
是 没有 意义 的 ， 比 如 说 库存 的 余额 ， 它 不 能 相 加 ， 只 能 用 折线 图 。 而 且 有 
的 时 候 为 了 方便 比较 ， 会 把 很 多 不 同 的 指标 放 在 一 起 ， 如 果 用 面积 图 就 会 
互相 遮挡 ， 不 利于 互相 比较 ， 所 以 也 会 用 折线 图 。 

从 表明 时 间 趋 势 的 折线 图 上 ， 无 论 是 不 同年 份 的 比较 还 是 同年 不 同月 
份 的 比较 ， 如 果 不 对 数据 钼 取 ， 是 看 不 出 太 多 有 价值 的 信息 的 。 在 折线 图 
上 看 到 某 一 年 或 者 某 一 个 月 中 的 相 比 数值 特别 大 或 者 特别 小 ， 可 以 钻 取 下 
去 ， 看 看 到 底 是 由 什么 数据 引起 的 。 某 一 个 数据 如 果 在 年 度数 据 中 数值 增 
加 比较 多 ， 可 能 是 平均 增加 得 比较 多 ， 但 更 多 的 情况 只 是 某 一 个 时 间 区 间 
增加 得 比较 多 。 这 样 的 话 ， 你 就 可 以 在 大 数据 集中 找到 异常 的 数据 。 

比如 说 ， 在 一 个 数据 分 析 主 题 中 汇集 了 10 年 的 数据 ， 每 天 新 增 1 000 
条 数据 ，10 年 的 数据 显然 会 是 很 大 的 量 。 如 果 其 中 有 一 天 的 数据 甚至 是 有 
一 条 记录 有 异常 ， 比 如 说 一 天 销售 特别 多 ， 在 分 析 的 时 候 就 可 以 通过 钻 取 
来 找到 这 条 特殊 的 记录 。 具 体 的 发 现 方法 是 这 样 的 ， 由 于 这 条 记录 会 导致 
该 年 的 平均 值 比较 大 ， 所 以 先 从 日 平均 销售 额 的 时 间 趋 势 看 ， 会 发 现 其 中 
一 年 的 平均 值 比较 大 ， 钻 取 这 年 数据 ， 看 到 按 月 分 布 的 平均 值 ， 又 发 现 其 
中 有 一 个 月 的 平均 值 比较 大 ， 再 钻 取 到 该 月 数据 ， 找 到 平均 值 大 的 日 期 ， 
然后 再 看 销售 记录 明细 ， 就 能 马上 找到 这 条 数据 ， 看 到 明细 状况 。 

单纯 看 时 间 维 度 ， 有 时 难以 看 出 特殊 的 问题 ， 这 时 可 以 从 其 他 维度 看 
到 一 些 异 常 ， 再 结合 时 间 维 度 看 历史 情况 ， 就 能 找 出 问题 所 在 。 比 如 发 现 
有 一 个 客户 的 销售 额 增长 特别 快 ， 我 们 会 在 客户 维度 上 锁定 这 个 客户 ， 看 
这 个 客户 的 历史 ， 从 他 的 历史 看 他 是 新 客户 还 是 老 客 户 。 结 果 发 现 他 虽然 
是 一 个 老 客户 ， 但 原来 采购 比较 少 ， 最 近 采 购 特别 多 ， 可 以 安排 销售 人 员 
了 解 一 下 他 最 近 采 购 多 的 原因 ， 有 针对 性 地 提供 服务 。 
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另外 ， 时 间 维 度 要 关注 是 同比 和 环比 。 同 比 是 看 每 个 月 的 数据 和 上 年 
同月 数据 的 比较 ， 环 比 就 是 这 个 月 数据 和 上 个 月 数据 的 比较 。 如 果 是 日 期 
的 话 ， 同 比 是 指 这 天 和 上 年 同一 天 的 数据 比较 ， 环 比 是 和 上 个 月 同一 天 的 
比较 。 

同比 可 以 按照 某 一 个 维度 ， 比 如 客户 ， 来 找 出 增长 最 大 的 客户 。 具 体 
就 是 对 同比 进行 排名 ， 找 出 同比 数值 最 高 的 10 个 客户 。 为 了 避免 有 些 合 
计数 值 比较 小 ， 但 同比 变化 比较 大 的 情况 ， 可 以 对 金额 和 同比 同时 进行 排 
序 ， 也 就 是 只 对 数值 排名 在 前 70% 的 客户 进行 同比 排序 。 所 以 ， 虽 然 合 计 
数值 的 同比 也 可 以 在 历史 时 间 维 度 上 比较 ， 但 要 直接 找 出 一 些 特殊 的 对 象 ， 
这 种 同比 TOP10 排名 揭示 的 信息 还 是 非常 多 的 。 

时 间 概 念 里 ， 还 有 一 个 叫 年 初 至 今 或 者 月 初 至 今 。 年 初 至 今 就 是 指 从 
本 年 的 1 月 1 日 开始 累计 的 数据 ， 用 于 在 概要 上 看 到 某 一 个 指标 累计 的 执 
行情 况 ， 可 以 看 到 到 目前 为 止 的 业绩 。 如 果 做 一 个 年 初 至 今 数据 的 同比 
比较 上 年 同一 天 的 累计 业绩 ， 可 以 在 日 常数 据 的 监控 中 ， 发 现 经 营 的 问题 。 
如 果 发 现 数据 同比 下 降 了 ， 就 要 去 找 出 下 降 的 问题 所 在 。 月 初 至 今 是 指 从 
本 月 1 日 开始 的 累计 数据 。 


4.2.7 空间 维度 直观 地 显示 数据 


在 数据 分 析 中 常常 会 遇 到 空间 维度 ， 空 间 维 度 最 典型 的 情景 即 是 行政 
区 域 。 

空间 维度 可 能 是 一 个 独立 的 维度 ， 即 维度 的 层次 结构 中 每 个 级 别 都 为 
空间 ， 比 如 按 区 域 显示 销售 额 或 GDP。 

空间 维度 也 可 能 是 维度 的 一 部 分 ， 即 层次 结构 中 上 层 几 个 级 别 为 空间 ， 
下 面 的 级 别 与 空间 无 关 ， 比 如 销售 分 析 中 ， 客 户 维度 所 在 的 区 域 为 空间 
客户 名 称 与 空间 无 关 。 

空间 维度 虽然 可 以 用 文字 描述 ， 但 若 用 地 图 ， 将 会 非常 直观 。 因 此 在 
很 多 数据 分 析 应 用 中 ， 常 常会 把 一 些 描述 区 域 的 维度 或 级 别 用 地 图 来 显示 。 

人 们 通过 在 地 图 上 标识 不 同 的 颜色 ， 来 表明 数据 的 大 小 。 点 击 地 图 不 





同 的 区 域 ， 可 以 进行 钻 取 ， 比 如 从 全 国 地 图 上 点 击 省 份 可 以 转 到 地 区 ， 单 
击 地 区 可 以 转 到 县 城 、 县 城 可 以 转 到 街道 。 


4.2.8 数据 的 可 视 化 钻 取 


利用 维度 模型 建 模 ， 可 以 实现 多 维度 并 行 操作 ， 通 过 数据 钻 取 可 达 最 
小 粒度 数据 ， 即 从 合计 数据 钻 透 到 明细 数据 。 虽 然 最 小 粒度 数据 是 一 个 ， 
但 可 以 从 多 个 维度 分 析 ， 从 多 个 维度 可 从 同一 个 数据 集中 钻 取 到 一 个 子 集 ， 
见 图 4-4。 

数据 的 粒度 越 小 ， 可 以 分 析 的 维度 越 多。 每 次 合计 ， 都 是 以 损失 一 个 
或 多 个 维度 〈 或 层级 级 别 ) 为 代价 的 。 比 如 说 最 小 粒度 数据 以 日 记录 ， 如 
果 生 成 月 度数 据 ， 则 无 法 分 析 数 据 按 日 的 分 布 情况 ， 也 无 法 按 周 分 析 每 周 
的 数据 变化 。 
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4-4 多 维度 数据 钻 取 到 最 小 粒度 记录 


通过 交互 操作 实现 可 视 化 的 数据 钻 取 ， 而 不 是 在 数据 上 选择 ， 可 以 大 
幅 提高 数据 分 析 的 效率 和 价值 。 以 下 为 在 日 期 维度 从 年 ( 见 图 4-5) 到 月 ( 见 
图 4-6) ， 再 到 日 的 钻 取 〈 见 图 4-7) 。 
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图 4-5 按时 间 维度 的 数据 钼 取 ，2012 一 2015 年 年 度数 据 
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图 4-6 按时 间 维 度 的 数据 钼 取 ，2015 年 月 份 数据 
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图 4-7 按时 间 维 度 的 数据 钻 取 ，2015 年 10 月 每 日 数据 


图 4-8、 图 4-9 是 从 客户 维度 向 下 钻 取 ， 从 一 个 省 到 该 省 的 客户 : 
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4.2.9 用 OLAP 提 升 统计 速度 


数据 时 代 的 主要 特征 就 是 处 理 的 都 是 大 数据 ， 大 数据 处 理 如 何 提高 速 
度 非 常 重要 。 

一 般 的 关系 数据 库 ， 现 在 又 称 作 OLIP 数据 库 ， 它 的 处 理 花费 时 间 会 随 着 数 
据 量 的 增加 指数 增加 。 当 然 这 里 的 数据 处 理 指 的 是 求 合计 或 平均 值 ， 而 不 是 一 
个 索引 查询 。 因 为 索引 可 以 快速 定位 到 指定 数据 ， 花 费时 间 不 会 指数 增加 。 

数据 分 析 更 多 的 要 涉及 全 体 数据 ， 所 以 索引 技术 是 无 效 的 。 在 这 种 
情况 下 如 果 用 OLTP 数据 库 来 处 理 类 似 的 问题 ， 它 查询 的 时 间 会 迅速 地 增 
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加 ， 这 个 增加 就 像 一 个 指数 曲线 ， 所 以 根本 无 法 使 用 ， 因 此 ， 需 要 专用 的 
OLAP 数据 库 。 

OLAP 数据 库 的 特点 是 , 如 果 查 询 很 小 的 数据 时 , 它 的 速度 也 不 会 很 快 ， 
相对 OLTP 来 说 可 能 还 慢 ， 但 如 果 数 据 很 大 ， 速 度 也 不 会 很 慢 ， 可 能 会 
微 慢 点 ， 但 随时 间 增 加 比较 平缓 。 用 Hadoop 来 实现 类 似 的 分 析 时 也 会 有 
类 似 的 问题 ， 就 是 即使 对 一 个 非常 小 的 数据 集 做 合计 ， 时 间 也 需要 几 十 秒 ， 
但 如 果 数 据 量 非常 大 ， 速 度 却 不 会 很 慢 。 

在 大 数据 的 应 用 中 也 会 用 到 关系 数据 库 ， 一 般 的 关系 数据 库 用 作 数 据 
仓库 数据 库 ， 这 种 数据 按照 一 个 数据 仓库 模型 来 组 织 数据 ， 但 数据 仍然 放 
在 关系 数据 库 里 。 有 一 些 人 认为 建 了 一 个 模型 以 后 就 是 完成 了 建 模 ， 实 际 
上 这 只 是 模型 的 一 个 图 纸 ， 并 没有 发 挥 实际 效益 ， 必 须 把 数据 整体 地 装 到 
OLAP Server 里 才 行 。OLAP Server 使 用 首先 要 进行 配置 ， 配 置 的 过 程 就 
是 和 数据 仓库 数据 库 里 的 数据 表 建 立 起 一 个 关系 ， 在 具体 构建 OLAP 立方 
时 它 会 从 这 里 面 读 取 数据 。 

OLAP 立方 的 构建 不 是 简单 地 把 数据 拷贝 到 OLAP Server， 而 是 在 里 
面 建立 一 个 内 部 结构 ， 会 对 数据 作 一 个 特殊 的 处 理 ， 主 要 的 处 理 就 是 进行 
预计 算 ， 也 就 是 说 把 可 能 用 的 一 些 条 件 的 组 合 结果 预先 计算 好 存在 这 里 。 
如 果 查 询 正好 是 这 些 条 件 组 合 的 话 ， 就 能 马上 反馈 汇总 的 结果 ， 不 需要 再 
进行 计算 。 但 如 果 查 询 没有 命中 这 种 组 合 ， 就 必须 进行 计算 ， 这 时 查询 速 
度 就 会 比较 慢 。 每 次 计算 的 结果 会 存 起 来 ， 如 果 下 次 有 相同 的 组 合 时 还 可 
以 使 用 ， 而 且 速 度 会 比较 快 。 

预计 算 保证 OLAP Server 使 用 越 多 ， 速 度 越 快 。 至 于 这 个 做 多 少 预计 
算 合适 ， 这 里 面 有 一 个 平衡 。 如 果 预 计算 太 多 ， 占 用 的 空间 会 比较 大 ， 而 
且 初 始 化 处 理 的 时 间 也 会 比较 长 ， 但 很 多 预计 算 的 结果 不 一 定 用 得 到 。 如 
果 预 计算 太 少 ， 虽 然 占 的 空间 比较 少 ， 但 计算 时 速度 会 比较 慢 ， 因 为 条 件 
稍微 变 一 下 就 会 超过 预计 算 的 范围 。 在 Oraccle OLAP 里 面 ， 预 计算 的 缺 
省 比例 是 40%， 但 也 有 一 些 书 上 介绍 一 般 15% 就 可 以 了 。 

如 果 想 把 这 些 条 件 组 合 都 做 预计 算 ， 这 在 某 些 书 中 有 一 个 专 有 名 词 是 
“ 维 灾难 ”, 也 就 是 说 维 的 组 合 是 一 个 非常 巨大 的 数据 ,是 不 可 能 实现 的 。 


现在 也 有 一 些 不 用 OLAP Server 的 软件 ， 自 己 会 做 一 些 轻 度 汇 总 。 但 
这 些 轻 度 汇总 和 它 的 功能 相关 ， 就 是 说 功能 中 需要 哪些 数据 ， 才 会 对 这 些 
数据 做 汇总 ， 那 这 样 就 明显 将 它 与 需求 挂钩 了 ， 无 法 满足 不 确定 的 需求 。 

采用 OLAP Server 的 主要 目的 是 做 一 个 无 方向 的 数据 挖掘 ， 也 就 是 说 
需要 面向 任意 需求 。 数 据 汇 总 的 预计 算 不 能 认为 确定 ， 而 要 有 算法 模型 的 
支撑 。 不 同 公司 提供 的 OLAP Server， 其 OLAP 立方 的 预计 算是 要 依赖 一 
些 算法 的 ， 比 如 说 冰山 立方 体 算法 、 外 过 立方 体 算法 等 ， 它 通过 一 些 算 法 
相对 科学 地 预先 计算 一 些 合计 结果 ， 保 证 查询 的 命中 率 尽 可 能 得 的 。 

在 鹰 眼 技术 里 ， 还 在 程序 这 一 层 做 了 一 个 缓存 。 虽 然 OLAP Server 的 
查询 速度 已 经 够 快 了 ， 但 因为 在 实际 应 用 中 常常 需要 从 多 个 数据 表 中 提取 
数据 ， 而 且 条 件 的 组 合 也 比较 复杂 ， 查 询 需 要 等 待 一 段 时 间 。 如 果 客户 在 
等 待 一 个 新 的 数据 分 析 图 形 ， 这 个 时 间 是 可 以 忍受 的 ， 但 如 果 刚 刚 看 过 一 
个 维度 的 数据 ， 在 看 下 一 个 维度 之 后 又 返回 ， 就 像 网 页 的 “上 一 页 ”一 样 ， 
等 待 这 个 时 间 会 感觉 太 长 ， 因 为 客户 概念 中 这 个 页 面 已 经 做 了 缓存 ， 应 该 
很 快 出 现 。 因 此 ， 在 程序 里 又 做 一 个 缓存 ， 让 客户 感觉 页 面 已 经 缓存 在 本 
机 了 ， 老 页 面 点 回去 就 非常 快 。 这 种 缓存 是 基于 OLAP Server 基础 上 的 二 
次 缓存 。 


4.2.10 数据 可 视 化 加 快 对 数据 的 认 知 


关于 人 类 视觉 的 重要 性 ， 大 卫 ， 麦克 坎 德 雷 斯 在 他 的 TED 演讲 《数据 
视觉 化 之 美 》 四 中 说 道 ， 视 觉 是 人 类 五 大 感 观 中 处 理 信息 速度 最 快 、 数 量 
最 大 的 。 他 引用 丹麦 物理 学 家 Tor Norretrandersde 的 研究 成 果 ， 意 思 是 ， 
人 类 大 脑 作为 高 级 信息 处 理 器 官 ， 有 很 多 的 信息 来 源 : 通过 眼睛 输入 的 视 
觉 信息 、 通 过 耳 采 输入 的 声音 信息 、 通 过 鼻子 输入 的 气味 信息 、 通 过 舌尖 
接触 的 味觉 信息 、 通 过 皮肤 触摸 接触 的 触觉 信息 ， 最 终 ， 这 些 信息 都 会 传 
输 到 大 脑 中 。 人 脑 对 这 些 信 息 接收 速度 区 别 非 常 大 ， 就 像 计算 机 联网 的 带 
宽 一 样 ， 不 同 信息 来 源 带宽 不 同 。 带 宽 就 是 同一 个 时 间 段 所 传输 的 字 节 数 ， 
带宽 宽 的 话 下 载 一 部 电影 可 能 非常 快 ， 带 宽窄 的 话 可 能 非常 慢 。 因 此 ， 不 
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同 的 带宽 在 同一 时 间 段 从 网 络 上 获取 的 信息 量 是 不 一 样 的 ， 如 图 4-10 所 示 
用 面积 大 小 标明 不 同感 官 的 带宽 。 


图 4-10 不 同感 官 的 带宽 





同 理 ， 我 们 大 脑 在 同一 段 时 间 对 不 同 的 信息 渠道 接收 的 信息 量 也 不 一 
样 ， 信 息 量 最 大 的 就 是 视觉 。 我 们 通过 眼睛 获取 的 信息 要 远 远 超过 其 他 方 
式 ， 其 次 是 听觉 、 味 觉 ， 最 少 的 是 触觉 。 

假如 我 们 要 听 一 段 五 分 钟 的 文字 汇报 ， 将 文字 要 传递 的 信息 绘制 成 一 张 
图 表 的 话 , 我 们 可 能 只 需要 花 1 秒 的 时 间 就 能 将 所 要 了 解 的 信息 传递 到 大 脑 。 

简 而 言 之 ， 如 果 把 信息 用 图 形 的 方式 展示 ， 再 输入 大 脑 的 话 ， 效 率 是 
最 高 的 。 这 就 是 现代 大 多 数 人 更 加 愿意 利用 图 形 来 展示 信息 的 一 个 重要 的 
原因 。 

数据 可 视 化 还 能 避免 对 数据 的 误 读 。 学 者 埃 姆 雷 * 索 伊 尔 (Emre 
Soyer) 和 罗 宾 。 霍 格 尔 斯 (Robin Hogarth) 做 了 一 个 有 趣 的 研究 。 研 究 对 
象 是 对 数据 毫 不 陌生 的 经 济 学 家 ， 三 组 经 济 学 家 分 别 回 答 了 一 组 数据 的 同 
样 一 个 问题 ， 一 组 经 济 学 家 拿 到 的 是 数据 和 数据 的 标准 统计 分 析 ，72% 的 
人 给 出 错误 答案 ， 另 一 组 拿 到 的 是 数据 、 统 计 分 析 ， 以 及 一 张 图 表 ， 答 案 
错误 率 仍 高 达 61%; 还 有 一 组 只 拿 到 图 表 ， 仅 有 3% 的 人 回答 错误 。p 

从 另 一 方面 来 看 ， 因 为 数据 表示 的 大 多 是 “1、2、3、4” 这 种 数字 信 
息 ， 我 们 知道 数字 是 人 类 的 一 种 发 明 ， 尤 其 是 阿拉 伯 数 字 ， 是 人 类 发 展 史 


上 一 项 伟大 发 明 ， 而 阿拉 伯 数 字 中 的 零 是 人 类 发 展 史上 更 加 伟大 的 一 个 发 
明 。 因此, 数字 是 人 类 发 明 出 来 的 , 而 不 是 与 生 俱 来 的 。 人 类 对 数字 的 判断 、 
识别 是 后 天 训练 的 结果 ， 而 不 是 天 生 的 。 但 是 ， 人 类 对 这 种 将 大 与 小 、 多 
与 少 表 示 成 图 形 的 识别 就 是 天 生 的 能 力 。 对 信息 的 识别 ， 以 图 形 展示 的 方 
式 相 对 其 他 方式 而 言 ， 人 的 负担 会 减少 许多 ， 这 也 是 把 数据 可 视 化 的 原因 。 


4.2.11 用 内 存 数据 库 实现 实时 数据 分 析 


虽然 大 多 数 情况 下 实时 数据 分 析 并 不 太 需 要 ， 但 不 乏 有 些 人 有 这 方面 
的 需求 。 

数据 分 析 一 般 分 为 以 下 几 个 过 程 : 

(1) 数据 的 初始 化 。 初 始 化 把 历史 上 多 年 的 数据 一 次 性 抽取 到 数据 
仓库 中 来 ， 这 需要 花费 较 长 时 间 。 

(2) 增 量 抽取 。 把 最 近 一 天 新 增加 的 数据 抽取 到 系统 中 来 ， 花 费时 
间 较 少 。 增 量 抽取 工作 一 般 安 排 在 半夜 进行 ， 当 业务 系统 停 用 以 后 ， 在 系 
统 资源 比较 空闲 的 情况 下 去 提取 它 的 数据 ， 这 样 的 话 对 业务 系统 的 使 用 没 
有 任何 影响 。 

(3) OLAP Cube 构建 。 把 数据 放 在 OLAP Server 中 ， 并 进行 预计 算 。 

这 样 处 理 后 ， 第 二 天 就 能 看 到 头 天 及 以 前 的 统计 数据 。 

如 果 要 实现 实时 数据 分 析 ， 就 必须 随时 进行 数据 增 量 抽取 和 OLAP 构 
建 ， 比 如 设计 一 个 定时 程序 ， 每 1 分 钟 或 者 5 分 钟 去 读 取 一 下 业务 部 门 的 
系统 。 这 样 的 话 ， 很 可 能 对 业务 系统 的 运行 产生 影响 。 另 外 ，OLAP 的 处 
理 也 需要 时 间 ， 不 能 在 1 分 钟 或 5 分 钟 能 完成 。 如 果 对 数据 实现 1 小 时 延 
时 的 数据 分 析 应 该 可 以 做 到 的 。 

现在 技术 上 也 在 向 实时 数据 分 析 方向 发 展 。SAP 公司 的 HANA 系统 
支持 实时 数据 分 析 。 它 的 原理 是 实现 一 个 内 存 的 数据 库 ， 所 以 汇总 的 速度 
非常 快 。 因 此 ， 不 再 需要 构建 OLAP Cube。 

当然 ， 这 里 有 几 个 条 件 : 

(1) 业务 系统 必须 在 SAP 的 HANA 中 运行 ， 即 它 的 业务 系统 (OLTP 
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系统 ) 必须 使 用 HANA 数据 库 ， 而 不 需要 把 OLTP 数据 读 到 HANA 中 ， 
保证 数据 读 取 在 内 存 中 进行 。 

(2) 需要 ROLAP 的 支持 ， 用 ROLAP ( 即 关 系 OLAP) 这 个 模型 去 
直接 读 取 关 系数 据 库 中 的 数据 。 

HANA 提供 了 建 模 工具 Modler， 在 建 模 后 可 用 MDX 语言 访问 
Cube。 目 前 主要 问题 是 除了 SAP 软件 以 外 ， 很 多 常用 软件 并 没有 移植 到 
HANA 上 。 

总 体 而 言 ， 未 来 的 趋势 是 数据 库 全 部 变 成 内 存 数据 库 ，OLAP 以 
ROLAP 为 主 而 无 须 MOLAP。 

由 于 用 于 数据 分 析 的 OLAP 数据 库 的 格式 与 事务 处 理 系统 的 OLTP 数 
据 库 不 同 ， 所 以 即使 有 了 内 存 数据 库 ， 定 时 加 载 步 又 还 是 不 可 缺少 ， 除 非 
只 是 直接 从 OLTP 数据 库 中 读 取 几 个 指标 值 ， 否 则 完全 的 实时 数据 分 析 还 
是 需要 耗费 很 多 资源 ， 具 体 就 看 是 否 值得 这 样 做 了 。 


4.3 ”改变 思路 


4.3.1 建立 基于 真实 数据 的 KPI 


数据 时 代 ， 关 注 和 处 理 的 应 该 是 反映 真实 世界 的 数据 ， 而 不 是 人 造 的 
数据 。 

管理 发 展 的 历史 上 ，KPI 是 一 个 重要 的 管理 工具 。 企 业 为 了 更 好 地 
管理 员工 ， 设 立 了 一 系列 的 关键 绩效 指标 (Key Performance Indicator， 
KPI) 。KPI 作为 一 种 企业 绩效 管理 工具 ， 把 企业 的 战略 目标 分 解 为 可 操 
作 的 工作 目标 ， 可 以 使 部 门 主管 明确 部 门 的 主要 责任 ， 并 以 此 为 基础 ， 明 
确 部 门人 员 的 业绩 衡量 指标 。 建 立 明确 的 切实 可 行 的 KPI 体系 ， 是 做 好 绩 
效 管理 的 关键 。 

KPI 制度 是 人 为 设 定 的 ， 它 的 标准 完全 是 人 为 的 ， 而 且 跟 效益 、 收 入 





密切 相关 ， 所 以 导致 企业 进入 两 个 误区 : 一 个 误区 就 是 公司 花 很 多 的 精力 
做 KPI 的 统计 和 分 析 、 打 分 ， 有 很 多 的 管理 人 员 花 费 很 多 时 间 参 与 其 中 ; 
第 二 个 误区 是 员工 靠 KPI 的 引导 工作 ，KPI 考核 的 就 做 ， 不 考核 的 就 不 做 ， 
而 不 是 以 客户 的 利益 和 公司 股东 的 利益 为 导向 。 

基于 数据 的 管理 ， 即 所 谓 量化 管理 ， 是 一 个 正确 的 方向 。 但 关键 是 如 
何 得 到 量化 管理 所 需要 的 数据 。 数 据 来 源 有 两 个 : 真实 数据 和 人 造 数据 。 
真实 数据 就 是 在 企业 经 营 中 由 事务 处 理 系统 产生 的 数据 ， 这 要 求 企业 信息 
化 水 平 较 高 ， 员 工 的 许多 日 常 工作 都 通过 信息 系统 完成 ， 并 留 下 记录 。 人 
造 数据 就 是 通过 同事 及 领导 打分 得 到 的 数据 ， 这 些 数据 可 能 是 有 些 行 为 无 
法 在 信息 系统 中 记录 ， 更 有 可 能 是 一 个 企业 信息 化 水 平 很 差 ， 没 有 记录 实 
际 经 营 情况 的 数据 。 

现在 企业 大 多 数 采用 混合 模式 ， 即 从 信息 系统 中 获取 数据 和 人 造 数据 
结合 。 如 果 刻 意 追求 KPI 体系 的 完整 性 ， 不 以 结果 为 导向 ， 希 望 员工 的 所 
有 工作 都 可 以 量化 追踪 ， 就 难免 出 现 很 多 人 造 数 据 。 鉴 于 KPI 制度 的 弊端 ， 
现在 有 很 多 的 公司 ， 比 如 发 明 KPI 的 埃 森 哲 公司 已 经 抛弃 了 KPI 模式 。 

一 个 理想 的 KPI 制度， 应 该 利用 现 有 的 数据 ， 根 据 信息 系统 中 可 以 获 
取 的 数据 编制 ， 而 且 KPI 仅 作 为 一 个 收入 和 晋升 的 参考 ， 而 不 是 直接 挂钩。 
当然 , 为 避免 人 造 数据 , 需要 加 强 企业 信息 化 建设 , 更 要 加 强 对 数据 的 开发 ， 
比如 建立 企业 级 数据 仓库 。 


4.3.2 为 实现 工业 4. 0 建立 数据 基础 设施 


工业 4.0 作为 制造 业 未 来 发 展 的 一 个 目标 , 是 正确 的 发 展 方向 。 工 业 4.0 
的 核心 是 实现 CPS (Cyber-Physical Systems) 系统 ， 也 就 是 虚拟 实体 系统 。 

什么 是 CPS 系统 呢 ? 

现在 存在 两 个 世界 : 一 个 是 实体 世界 社会 ， 即 传统 的 制造 业 ， 也 就 是 
物质 制造 ， 第 二 个 是 虚拟 世界 ， 即 我 们 的 信息 世界 或 虚拟 世界 。 从 物 联网 
和 人 联网 的 角度 来 说 ， 物 联网 涉及 实体 世界 ， 关 平 物 到 物 的 沟通 和 控制 ; 
人 联网 涉及 虚拟 世界 ， 关 乎 人 与 人 之 间 沟 通 和 控制 。 
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工业 4.0 的 目标 就 是 实体 世界 和 虚拟 世界 的 融合 ， 物 联网 和 人 联网 的 
融合 。 比 如 在 一 个 社交 网 络 上 可 以 对 产品 提出 需求 ， 对 设计 进行 修改 ， 然 
后 这 些 信息 可 以 传输 到 以 物 联 网 为 基础 的 这 种 智能 制造 系统 上 ， 智 能 制造 
系统 就 能 根据 这 种 信息 制造 出 一 个 实际 的 物理 产品 ， 并 且 通 过 物流 发 送 给 
需求 者 。 

某 人 过 生日 ， 我 们 可 以 有 两 个 祝福 的 方案 : 一 个 是 实体 世界 方案 ， 另 
一 个 是 虚拟 世界 方案 。 在 实体 世界 过 生日 ， 去 蛋糕 店 买 个 蛋糕 ， 写 上 名 字 、 
年 龄 ， 过 几 天 去 取 或 者 送 货 上 门 。 在 虚拟 世界 过 生日 ， 可 以 在 QQ 上 送 生 
日 礼物 ， 比 如 送 一 个 虚拟 的 蛋糕 ， 通 过 QQ 发 送 。 在 实现 工业 4.0 以 后 ， 
这 两 个 世界 可 以 完全 融合 在 一 起 ， 在 QQ 上 看 到 别人 生日 就 可 以 送 个 蛋糕， 
选中 一 个 蛋糕 以 后 ， 这 个 信息 会 传送 到 实体 蛋糕 店 ， 蛋 糕 店 根据 这 个 信息 
做 出 蛋糕 、 打 上 名 字 和 年 龄 ， 再 通过 物流 送 到 指定 的 对 象 家 里 去 。 

大 家 知道 ， 现 在 即使 送 生日 蛋糕 简单 的 虚拟 实体 系统 也 没 能 实现 。 如 
果 是 复杂 应 用 呢 ? 比如 说 我 们 想 定制 一 辆 汽车 ， 如 何 网 络 定制 、 下 单 ， 实 
体制 造 、 送 货 ， 就 更 加 复杂 ， 需 要 对 整个 制造 体系 进行 改造 。 

仔细 分 析 虚 拟 实体 系统 的 实现 流程 ,可 以 分 解 为 几 个 共同 具备 的 过 程 : 
第 一 ， 通 过 人 联网 收集 客户 的 需求 ， 第 二 ， 通 过 物 联 网 了 解 现在 设备 的 运 
营 情况 ;第 三 ， 下 达 具 体 生 产 的 指令 ; 第 四 ， 得 到 生产 状态 的 反馈 。 

客户 既然 是 定制 的 ， 就 需要 跟踪 。 比 如 ， 一 辆 汽车 的 生产 周期 要 30 天 ， 
显然 对 于 客户 来 说 ， 他 在 虚拟 平台 上 面 下 了 购买 指令 后 ， 表 定 需 要 跟踪 生 
产 的 状况 ， 确 切 知道 什么 时 候 能 够 提货 。 

综 上 所 述 ， 实 现 工业 4.0 的 前 提 是 已 经 有 了 比较 成 熟 的 数据 技术 。 必 
须 了 解 设备 的 运营 情况 ， 知 道 现在 有 多 少 台 设备 ， 设 备 的 生产 能 力 如 何 ， 
生产 状态 如 何 。 要 通过 物 联网 技术 采集 这 些 数 据 ， 而 且 让 管理 者 能 看 到 这 
些 数据 ， 这 些 数据 最 终 还 应 该 能 够 直接 通过 人 联网 送 达 客户 。 

比如 说 现在 要 订 一 个 蛋糕 ， 显 然 先 要 知道 周边 方圆 几 公 里 之 内 有 几 家 
蛋糕 店 ， 了 解 蛋糕 店 的 订单 情况 和 执行 进度 。 如 果 要 求 蛋糕 在 下 午 1 点 钟 
送 达 ， 这 种 情况 下 ， 先 要 查 一 下 附近 哪个 店 现在 具有 按时 送 达 能 力 。 这 个 
能 力 不 是 根据 口头 承诺 ， 而 是 根据 数据 判断 出 来 的 。 比 如 ， 做 一 个 蛋糕 需 


要 两 个 小 时 ， 那 么 就 必须 在 11 点 之 前 开始 制作 ， 如 果 有 和 蛋糕 店 12 点 钟 才 
能 开始 制作 就 来 不 及 。 可 以 根据 设备 数据 判断 制作 开始 时 间 ， 蛋 糕 店 有 多 
少 台 设 备 ， 设 备 的 生产 能 力 ， 设 备 现在 的 工作 负荷 情况 ， 设 备 的 检修 情况 ， 
今天 总 共有 几 台 设备 在 正常 运行 ， 据 此 判断 这 个 单子 能 不 能 排队 11 点 钟 
前 开始 生产 。 下 单 以 后 ， 还 需要 了 解 制作 情况 的 反馈 : 制作 过 程 中 是 否 按 
计划 执行 ， 中 间 有 没有 出 现 故 障 。 

所 以 ， 实 现 工业 4.0 首先 要 求实 现 智 能 制造 。 在 现 有 设备 基础 上 第 一 
个 就 是 设备 必须 智能 化 ， 必 须 能 采集 数据 ;第 二 个 数据 是 能 够 联网 的 ; 第 
三 个 数据 是 能 被 共享 的 。 如 果 没 有 这 些 数据 ， 那 就 根本 不 可 能 实现 物 联网 
的 功能 。 

另外 最 大 的 问题 是 关于 人 联网 的 问题 。 显 然 要 实现 工业 4.0， 人 联网 
非常 重要 。 虽 然 现在 互联 网 很 发 达 ， 单 独 实现 人 联网 不 是 问题 。 但 如 果 需 
要 一 个 企业 独立 实现 工业 4.0 的 话 ， 既 要 求 该 企业 具备 先进 的 制造 能 力 ， 
又 具备 互联 网 的 开发 经 营 能 力 ， 软 硬 都 要 通 ， 这 是 不 太 现实 的 ， 也 违背 现 
在 社会 分 工 细 化 的 要 求 。 如 果 有 其 他 社会 组 织 能 提供 全 部 或 部 分 人 联网 的 
功能 ， 让 制造 业 企业 专注 于 制造 ， 则 实现 工业 4.0 更 为 容易 。 

因此 ， 数 据 的 社会 化 的 运营 ， 对 工业 4.0 是 一 个 非常 重要 甚至 是 一 个 
必要 的 条 件 。 我 们 必须 通过 对 数据 领域 的 规划 和 布局 ， 使 得 社会 的 信息 ， 
就 是 人 联网 的 信息 能 够 非常 容易 地 获取 和 传送 。 而 这 种 社会 化 的 运营 不 是 
靠 像 中 国 的 阿里 巴巴 或 者 腾讯 那样 的 第 三 方 企业 来 实现 ， 而 是 建立 一 个 基 
础 设施 ， 就 像 公路 和 铁路 一 样 ， 然 后 在 基础 设施 上 再 连接 这 些 相关 的 企业 。 

我 们 知道 ， 传 统 行业 设施 建设 比较 成 熟 ， 新 兴 产 业 完全 可 以 借鉴 传统 
产业 的 经 验 。 比如, 交通 领域 的 机 场 是 公用 设施 , 公路 、 铁路 也 是 公用 设施 
在 上 面 跑 的 飞机 、 汽 车 、 火 车 可 以 是 不 同 个 人 或 公司 的 。 中 国 铁路 总 公司 
这 种 企业 , 既 造 铁路 , 又 造 火 车 , 还 运营 线路 , 只 能 是 国有 企业 的 运营 方式 ， 
不 可 能 由 私营 企业 来 实现 。 但 现在 中 国 铁路 也 在 探索 吸收 社会 资本 的 加 入 。 
所 以 工业 4.0 的 虚拟 世界 建设 也 需要 分 为 公用 设施 建设 和 企业 独立 建设 两 
个 层面 ， 数 据 的 公用 设施 建设 对 工业 4.0 的 实现 非常 重要 。 
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4.3.3 主动 抽取 数据 实现 数据 集中 


加 强 顶 层 设计 和 统筹 协调 ， 大 力 推动 政府 信息 系统 和 公共 数据 互联 开 
放 共享 , 加 快 政府 信息 平台 整合 , 消除 信息 孤岛 ,推进 数据 资源 向 社会 开放 ， 
增强 政府 公信 力 ， 引 导 社 会 发 展 ， 服 务 公众 企业 。 

国务 院 《促进 大 数据 发 展 行动 纲要 》 

在 数据 时 代 ， 如 何 汇集 异 构 系统 的 数据 ， 解 决 数据 孤岛 ， 是 一 个 技术 
难题 。 

目前 ， 一 般 要 求 从 下 到 上 报 送 数据 。 就 是 先 制定 一 个 数据 标准 ， 然 后 
要 求 数据 源 的 企业 开发 专门 软件 ， 将 数据 发 送 到 上 级 数据 中 心 。 这 种 数据 
集中 法 一 般 要 通过 行政 命令 来 执行 ， 数 据 源 单位 的 工作 量 比较 大 。 

数据 报 送 的 方式 对 上 级 单位 来 说 ， 是 集中 数据 的 一 种 比较 简便 的 方法 ， 
只 需要 制定 数据 交换 标准 ， 要 求 下 属 单位 按 标 准 报 送 数据 即 可 。 自 己 工作 
量 比较 小 ， 而 下 属 单位 工作 量 比较 大 。 如 果 数 据 集 中 的 任务 不 能 按时 完成 
的 话 ， 主 要 责任 在 下 属 单位 ， 所 以 比较 适合 具有 行政 隶属 关系 的 单位 。 

数据 报 送 软件 的 开发 有 比较 大 的 工作 量 。 由 于 不 同 软件 由 不 同 软件 公 
司 在 不 同时 间 开 发 ， 在 运行 一 段 时 间 后 ， 要 找到 原 开发 公司 和 原 开发 人 员 
比较 困难 ， 也 难以 面向 社会 重新 招标 ， 所 以 开发 成 本 会 比较 高 。 

由 于 数据 分 析 技 术 不 够 成 熟 ， 数 据 源 单位 无 法 知道 发 送出 的 数据 对 自己 
有 什么 用 处 ,分 享 不 到 数据 分 析 的 具体 效果 , 因此 也 对 数据 集中 缺乏 积极 性 。 

综 上 所 述 ， 用 数据 报 送 方式 解决 数据 集中 问题 ， 造 成 的 后 果 可 能 是 
成 本 高 、 拖 延 时 间 长 、 风 险 大 、 效 益 低 。 

解决 以 上 问题 的 一 个 最 好 方法 是 “ 取 数 据 ”， 就 是 由 数据 中 心 去 各 个 
数据 源 单 位 定时 抽取 数据 。 用 取 数据 代替 送 数据 ， 可 以 将 分 摊 到 多 个 软件 
开发 公司 的 工作 统一 委托 给 一 家 开发 公司 。 数 据 源 企业 只 需 开 放 数 据 ， 减 
轻 了 数据 集中 的 阻力 。 

对 数据 分 析 的 结果 应 该 及 时 分 享 到 数据 源 单位 ， 这 有 利于 促进 数据 源 
单位 配合 工作 的 积极 性 。 

假设 在 医疗 数据 的 收集 中 ， 不 需要 医院 投入 太 多 ， 就 能 分 享 一 个 地 区 


或 者 全 国 的 医疗 收费 数据 ， 那 么 在 医院 医疗 资源 的 配置 和 收费 标准 的 制订 
上 ， 都 会 对 医院 有 非常 大 的 帮助 ， 所 以 各 医院 会 积极 配合 这 件 工作 。 


4.3.4 统计 数据 从 报 送 到 抽取 


政府 统计 数据 往往 出 现 很 多 问题 : 相互 标准 不 统一 、 信 息 共享 不 畅 、 
数 出 多 门 及 数字 打架 ， 导 致 数据 的 不 一 致 。 从 填报 企业 来 说 ， 面 向 财税 、 
审计 、 统 计 等 不 同 的 部 门 往往 从 各 自 利 益 角 度 出 发 填报 不 同 的 数据 及 几 套 
报表 的 现象 严重 影响 了 统计 数据 质量 。 

若 按 照 传统 方式 收集 统计 数据 ， 这 种 问题 难以 避免 。 解 决 问题 的 方法 
是 改 报 数据 为 取 数 据 。 报 数据 的 话 要 经 过 人 手 ， 这 中 间 会 有 动机 和 机 会 对 
数据 进行 修改 。 取 数据 ， 因 为 数据 源 只 有 一 个 ， 不 经 人 手 ， 没 有 机 会 修改 
数据 ， 数 据 不 需 人 工 汇总 而 是 自动 汇总 。 

保证 数据 准确 的 另 一 个 方法 是 数据 产生 和 统计 目标 分 离 ， 也 就 是 数据 
的 产生 和 保存 应 该 是 出 于 其 他 的 目的 ， 该 目的 和 统计 不 相干 。 比 如 取 财 务 
数据 ， 和 凭证 的 数量 比较 多 又 有 复杂 的 钩 稽 关系 ， 如 果 要 作假 工作 量 比较 大 ， 
并 且 财 务 软件 的 使 用 并 不 是 完全 为 了 统计 的 需要 ， 所 以 基于 财务 凭证 得 到 
的 统计 数据 相对 准确 性 比较 高 。 如 果 只 看 财务 数据 的 生成 报表 ， 虽 然 有 一 
定 的 钧 稽 关系 , 但 由 于 报表 相对 数据 较 少 , 并 且 不 太 复杂 , 就 比较 容易 作假 。 

类 似 地 ， 如 果 根 据 出 库 数据 来 统计 企业 销售 收入 ， 得 到 的 结果 就 会 比 
较真 实 。 因 为 企业 记录 进出 库 数 据 主要 用 于 计算 库存 ， 用 于 内 部 管理 的 目 
的 ， 而 且 数据 量 比较 大 ， 难 以 作假 。 当 然 这 种 数据 取 法 的 工作 量 比较 大 ， 
是 一 个 长 期 的 、 艰 巨 的 工作 ， 但 也 只 有 按照 这 个 目标 去 做 ， 才 能 彻底 解决 
这 样 的 问题 。 


4.3.5 改进 数据 分 析 工 作 流程 


现在 很 多 的 互联 网 公司 以 及 游戏 公司 对 大 数据 的 应 用 非常 重视 ， 很 
多 已 经 在 Hadoop 技术 上 进行 了 投资 ， 但 大 部 分 可 能 只 是 设置 了 数据 分 析 
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的 岗位 。 

现在 来 分 析 一 些 大 数据 分 析 工 作 的 流程 ， 结 合 自助 分 析 系 统 的 使 用 ， 
提出 改进 意见 。 

互联 网 公司 拥有 大 量 的 数据 ， 这 些 数据 可 能 存在 普通 的 关系 数据 库 ， 
比如 Oracle， 或 者 存在 大 数据 的 分 布 式 文件 系统 ， 比 如 Hadoop 中 。 

在 需要 使 用 数据 的 时 候 ， 就 从 这 些 数 据 库 中 提取 数据 。 因 为 Hadoop 
可 以 利用 Hive 工具 用 类 似 SQL 语言 读 取 数 据 ， 所 以 我 们 把 Hadoop 加 
Hive 也 当 作 普通 的 数据 库 来 对 待 。 取 得 数据 之 后 ， 用 一 些 统计 分 析 工 具 
来 分 析 。 常 用 的 统计 分 析 工 具有 SPSS 和 SAS， 也 有 简单 的 就 用 Excel 和 
Tableau 等 可 视 化 的 工具 进行 分 析 ， 最 后 把 分 析 结 果 和 生成 的 统计 图 形 写 
在 Word 报告 或 PPT 演示 中 提交 给 领导 或 业务 部 门 。 软 件 开 发 人 员 和 业务 
运营 人 员 根 据 这 些 数据 分 析 的 结果 修改 程序 或 者 调整 业务 ， 比 如 电子 商务 
公司 会 根据 销量 数据 分 析 来 调整 货物 的 存货 。 

在 以 上 数据 利用 过 程 中 ， 关 键 在 于 对 数据 的 访问 必须 有 一 个 长 的 流程 。 

一 般 来 说 ， 数 据 分 析 人 员 对 IT 系统 的 数据 库 不 是 很 熟悉 ， 他 需要 给 
IT 人 员 提 出 需求 ， 由 IT 人 员 协 助 获取 数 据 。 数 据 可 能 已 经 存在 数据 库 中 ， 
只 需 直接 写 一 个 SQL 语言 命令 就 可 以 提取 。 也 有 可 能 数据 比较 复杂 ， 存 在 
多 个 数据 表 中 ， 需 要 通过 连接 来 提取 。 还 有 一 些 汇 总 数据 ， 比 如 说 按 区 域 
的 销售 数据 区 汇总 ， 可 能 需要 经 过 比较 长 时 间 的 汇总 计算 才能 得 到 。 更 有 
一 些 数据 ， 可 能 在 数据 库 中 没有 保存 ， 需 要 修改 程序 ， 扩 充 功 能 ， 增 加 需 
要 采集 数据 的 字段 ， 才 能 获取 数据 分 析 人 员 需 要 的 数据 。 所 以 ， 数 据 分 析 
人 员 需 要 等 待 得 到 数据 ， 而 IT 人 员 可 能 业务 比较 繁忙 ， 向 他 索取 数据 的 人 
比较 多 ， 或 者 由 于 开发 水 平 的 限制 ， 不 能 及 时 提供 给 数据 分 析 人 员 ， 所 以 
数据 分 析 人 员 的 工作 受制 于 IT 人 员 。 

同样 ， 业 务 人 员 为 了 更 好 地 开展 业务 ， 则 需要 来 自 数据 分 析 人 员 的 分 
析 结 果 。 也 就 是 说 ， 他 需要 向 数据 分 析 人 员 提 出 请 求 ， 然 后 由 数据 分 析 人 
员 通 过 分 析 ， 对 业务 的 工作 提出 指导 意见 。 那 么 ， 数 据 分 析 人 员 由 于 分 析 
工作 繁多 或 者 是 人 手 不 足 ， 甚 至 是 IT 部 门人 员 的 配合 有 问题 ， 也 难以 响应 
业务 部 门人 员 的 请 求 或 者 可 能 不 能 及 时 响应 。 


图 4-11 显示 的 是 现在 数据 分 析 工 作 的 流程 。 
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图 4-11 现在 的 流程 


由 此 看 来 ， 要 提高 组 织 的 运行 效率 ， 对 数据 分 析 工 作 改 进 的 最 好 方式 
就 是 业务 部 门人 员 可 以 跳 过 数据 分 析 人 员 和 IT 部门 人员 ， 直 接 从 数据 中 发 
现 运营 中 的 问题 。 

如 果 我 们 有 一 个 自助 分 析 系 统 ， 可 以 直接 从 数据 源 抽取 数据 并 且 生 成 
统计 图 形 ， 业 务 人 员 可 以 直接 通过 图 形 发 现 问 题 ， 就 可 以 大 大 提高 企业 的 
工作 效率 。 

当然 ， 有 了 自助 分 析 系 统 以 后 ，IT 人 员 和 数据 分 析 人 员 并 不 是 无 事 可 
做 。 因 为 这 种 分 析 虽 然 采 用 了 过 度 设计 ， 但 肯定 不 能 百 分 百 地 满足 数据 分 
析 需 求 ， 比 如 说 本 身 在 事务 处 理 系统 里 没有 数据 ， 这 肯定 无 法 进行 分 析 ， 
所 以 还 是 需要 IT 人 员 去 增加 数据 的 采集 内 容 。 同 样 地 ， 有 些 复杂 的 数据 分 
析 还 是 需要 数据 分 析 人 员 进 行 分 析 。 

所 以 ， 自 助 分 析 系 统 可 能 只 能 满足 80% 的 通用 数据 分 析 需 求 。 原 来 数 
据 分 析 人 员 全 部 利用 IT 人 员 来 获取 数据 ， 有 了 自助 分 析 系 统 后 ， 现 在 有 
80% 可 以 通过 系统 来 获取 数据 。 如 果 需 要 进一步 分 析 ， 可 以 把 数据 导入 平 
面 文件 中 ， 通 过 其 他 的 软件 ， 比 如 有 语言， 来 进行 数据 挖掘 。 同 样 ， 业 务 
人 员 有 80% 的 需求 也 可 以 直接 看 自助 分 析 系 统 ， 还 有 20% 可 以 委托 数据 
分 析 人 员 去 做 深入 挖掘 。 改 进 后 的 流程 见 图 4-12。 
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4-12 改进 后 的 流程 


4.4 适应 数据 分 析 的 硬件 


在 目前 ， 硬 件 的 配置 已 经 远 远 超 过 了 实际 的 需求 。 现 在 互联 网 公司 在 
发 展 上 遇 到 的 瓶颈 主要 有 两 个 : 首先 由 于 物理 的 限制 使 它 在 同样 面积 的 芯 
片上 难以 集成 更 多 的 晶体 管 ， 其 次 是 它 的 高 性 能 CPU 功能 已 经 超过 了 客户 
的 需求 ， 现 有 大 多 数 软件 无 法 发 挥 这 种 CPU 的 功能 ， 也 就 是 说 ，CPU 最 
好 最 贵 ， 对 软件 来 说 在 使 用 过 程 中 对 软件 性 能 的 影响 也 根本 显现 不 出 来 。 

但 在 数据 分 析 应 用 中 则 不 同 ， 现 在 服务 器 的 功能 还 远 远 不 够 ， 主 要 是 因 
为 大 数据 分 析 的 计算 量 非常 大 ， 并 且 使 用 过 程 中 出 现 明 显 的 波峰 波 谷 现象 。 

如 果 客 户 的 请 求 正好 命中 预计 算 的 结果 ， 则 查询 的 速度 会 非常 快 。 但 
若是 没有 命中 ， 它 就 会 需要 进行 大 量 的 计算 。 由 于 计算 涉及 很 大 的 数据 集 ， 
计算 过 程 中 会 耗费 很 大 的 CPU、 内 存 包括 硬盘 ， 会 造成 在 短期 内 占用 大 部 
分 服务 器 的 资源 。 因 此 ，OLAP 的 应 用 不 适应 和 OLTP 的 应 用 共用 服务 器 。 

OLTP 的 应 用 虽然 每 次 访问 涉及 的 数据 比较 少 ， 每 个 用 户 对 资源 的 需 
求 量 不 大 ， 但 由 于 访问 的 人 很 多 ， 众 多 的 请 求 下 会 对 资源 的 累计 需求 比较 


大 。 不 过 ， 由 于 这 些 访问 在 时 间 上 是 随机 的 ， 分 布 比较 均匀 ， 因 此 对 服务 
器 资源 的 需求 会 比较 均衡 。 

如 果 在 一 个 运行 比较 均衡 的 OLTP 的 服务 器 上 加 上 一 个 OLAP 的 应 用 ， 
它 会 在 短 时 间 内 对 服务 器 的 性 能 有 一 个 虹吸 的 作用 ， 受 此 影响 ，OLTP 的 
软件 运行 可 能 会 间歇 性 地 变 慢 ， 因 此 极 大 地 影响 其 他 信息 系统 的 正常 运行 。 

在 硬盘 的 使 用 上 ， 为 了 保证 数据 安全 ， 通 常情 况 下 应 采用 磁盘 阵列 。 
但 是 ， 在 OLAP 应 用 中 ， 用 磁盘 阵列 主要 在 于 考虑 提高 数据 访问 速度 ， 因 
而 肯定 需要 RAID0。 至 于 是 否 需 要 加 RAID1, 看 条 件 是 否 人 允许 , 应 尽量 加 上 。 
条 件 不 允许 时 ， 不 加 未 必 会 产生 致命 的 影响 。 因 为 即使 数据 丢失 了 也 可 以 
重新 取 数 ， 虽 然 会 耽误 一 些 时 间 ， 但 不 会 造成 对 数据 的 不 可 道 的 影响 。 

由 于 普通 机 械 硬盘 的 速度 与 它 磁 头 的 寻 址 和 读 取 速 度 有 关 ， 并 且 每 个 
硬盘 的 访问 速度 都 是 有 限 的 ， 如 把 所 有 的 数据 都 放 在 一 个 硬盘 上 ， 大 量 的 
数据 访问 都 要 依赖 这 个 硬盘 的 读 取 速 度 。 通 过 RAID0 把 数据 分 布 在 不 同 
的 硬盘 上 ， 读 取 可 以 并 行进 行 ， 便 可 大 大 加 快 数据 读 取 的 速度 。 

在 SSD 硬盘 出 现 后 ， 磁 盘 读 写 速度 已 经 不 太 重 要 ， 应 该 尽 可 能 采用 
SSD 做 硬盘 。 以 SAP HANA 为 标志 的 内 存 数据 库 出 现 ， 可 以 把 数据 放 在 
内 存 中 ， 速 度 会 更 快 。 
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5.1 数据 革命 的 作用 


5. 1.1 对 国家 治理 的 作用 


对 大 国 的 治理 ， 一 般 采用 联邦 制 和 中 央 集 权 制 两 种 统治 模式 。 联 邦 制 
主要 优点 是 各 问 其 政 ， 互 相 不 搭界 ， 大 部 分 事务 由 各 联邦 主体 分 别 来 处 理 ， 
只 有 部 分 的 权力 让 渡 于 中 央 。 比 如 美国 是 州 的 权力 比较 大 ， 国 家 重点 在 国 
防 和 外 交 上 面 。 而 中 央 集 权 制 的 权力 由 中 央 主 导 ， 下 面 的 官员 全 部 由 中 央 
任命 。 

中 国 采用 中 央 集 权 制 ， 这 跟 中 国 的 地 理 相对 比较 集中 有 关 。 秦 始 皇 统 
一 六 国之 前 ， 各 诸侯 国 的 文字 、 度 量 衡 、 货 币 都 不 一 致 ， 给 人 们 的 生活 和 
经 济 活动 造成 了 很 大 不 便 ， 所 以 在 秦始皇 统一 后 建立 了 持续 至 今 的 中 央 集 
权 制 。 因 此 ， 中 央 集 权 制 在 中 国 既 有 历史 渊源 ， 又 有 其 合理 性 。 但 中 央 集 
权 制 也 有 很 多 问题 : 第 一 个 是 不 同 地 方 情况 千差万别 ， 如 何 面 对 个 性 化 问 
题 ; 第 二 个 是 这 么 庞大 的 机 构 怎 样 去 管控 。 在 信息 时 代 ， 这 种 管控 比 信息 
闭塞 的 时 代 更 为 方便 ， 但 总 的 来 说 还 是 没有 达到 预期 的 目的 ， 主 要 问题 是 
没有 充分 利用 数据 。 

信息 化 能 够 把 所 有 的 事物 量化 。 现 在 虽然 有 了 数据 ， 但 对 数据 的 认识 
还 停留 在 对 单个 数据 的 利用 。 数 据 的 汇总 还 要 通过 统计 局 这 类 政府 机 构 经 
过 层 层 加 工 得 到 。 现 在 统计 局 已 经 搞 了 直 报 系统 ， 由 企业 直接 填报 、 直 接 
汇总 。 在 数据 时 代 ， 类 似 这 种 直 报 系统 不 但 应 该 搞 ， 而 且 应 该 大 力 高 ,但 
不 是 所 有 数据 都 可 以 直 报 的 ， 而 且 统 计 直 报 会 抹杀 各 地 的 个 性 化 ， 挫 伤 地 
方 政府 的 积极 性 。 统 计 直 报 是 一 种 理想 化 的 信息 孤岛 解决 模式 ， 它 不 具备 
通用 性 ， 更 多 的 应 该 建立 分 布 式 的 数据 仓库 。 


数据 获取 的 理想 方式 应 该 是 各 地 建立 分 布 式 系统 。 不 同 的 县 、 市 可 以 
通过 县 来 统一 、 市 来 统一 或 者 省 来 统一 ， 然 后 建立 一 些 局 部 的 数据 仓库 ， 
通过 分 布 式 的 检索 ， 对 数据 进行 统计 汇总 。 数 据 仓 库 以 地 级 市 为 中 心 建立 
比较 合适 。 如 果 采 用 这 种 模式 的 话 ， 由 各 个 地 方 报 数 据 变 成 了 中 央 来 取 数 
据 ， 就 比较 灵活 了 。 

中 央 直 取 数 据 可 以 及 时 掌握 各 地 的 情况 ， 不 需要 在 出 现 问 题 的 时 候 通 
过 分 派 政府 官员 到 各 地 调研 的 方式 来 解决 。 在 政府 工作 的 报道 中 ， 大 多 数 
是 中 央 领 导 到 地 方 考察 、 座 谈 的 消息 ， 无 论 是 领导 调研 还 是 汇报 ， 很 少 看 
到 数据 发 挥 的 作用 。 口 头 交流 或 文字 汇报 大 多 是 无 法 量化 的 感性 东西 ， 只 
有 通过 汇总 数据 才能 准确 掌握 宏观 情况 。 

在 中 国 古代 ， 为 了 支撑 中 央 集 权 统 治 ， 建 立 了 多 种 机 制 。 一 个 机 制 是 
各 地 建立 驿站 ， 保 障 邮 路 的 畅通 ， 保 证 中 央 和 地 方 的 信息 能 够 及 时 交换 。 
另 一 个 是 官员 的 选拔 ， 通 过 科举 考试 来 从 地 方 选拔 优秀 人 才 ， 并 直接 任免 
地 方 长 官 。 

在 数据 时 代 ， 应 该 像 以 前 重视 邮 路 建设 一 样 ， 重 视 数据 的 畅通 。 我 们 
虽然 关注 上 传 下 达 ， 实 际 上 重点 是 下 达 而 不 是 上 传 ， 更 多 地 重视 把 中 央 的 
指示 通过 文件 的 形式 或 者 通过 新 闻 媒 体 、 网 络 媒体 向 下 传递 。 

上 传 实际 上 是 一 种 反馈 。 如 国家 作为 一 个 物理 系统 ， 缺 少 一 个 有 效 的 
反馈 机 制 是 不 利于 系统 完美 运转 的 。 反 馈 机 制 仅仅 通过 调研 是 远 远 不 够 的 ， 
而 是 需要 更 多 通过 数据 。 统 计 局 统计 系统 的 建立 ， 初 衷 就 是 建立 一 个 反馈 
系统 ， 但 比较 初级 : 一 是 数据 收集 起 来 还 不 是 很 准确 ; 二 是 数据 加 工 过 程 
中 会 受到 一 些 人 为 的 和 干扰， 导致 数据 失真 。 而 且 数据 经 过 汇总 ， 失 去 了 很 
多 特征 ， 不 利于 决策 支持 。 

国家 应 该 建立 一 个 基于 分 布 式 数据 仓库 的 反馈 机 制 。 


5.1.2 对 国有 企业 改革 的 作用 


国有 企业 的 改革 ， 无 论 方向 如 何 、 采 取 何 种 措施 ， 都 需要 良好 的 反馈 
机 制 。 这 种 反馈 机 制 首先 用 于 了 解 国企 准确 、 详 细 的 情况 ， 其 次 用 于 评估 
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改革 的 效果 。 

国有 企业 是 国家 拥有 全 部 或 部 分 股权 ， 国 家 对 企业 运行 具有 控制 力 的 
一 类 企业 。 国 有 企业 主要 集中 在 一 些 垄 断 行业 或 者 基础 民生 行业 。 因 为 缺 
少 市 场 竞争 ， 并 受 体制 约束 ， 国 有 企业 的 经 营 和 管理 是 一 个 很 大 的 难题 。 
在 现 有 技术 水 平 下 ， 为 解决 这 些 难 题 ， 很 多 国家 ， 特 别 是 西方 国家 ， 认 为 
竞争 是 唯一 有 效 的 管理 方式 ， 因 此 大 都 选择 私有 化 。 

对 于 各 种 原因 不 能 私有 化 的 企业 ， 数 据 可 以 发 挥 非常 大 的 作用 ， 利 用 
数据 技术 可 以 解决 现在 难以 解决 的 许多 问题 。 

中 国 的 国有 企业 现在 的 主要 改革 方向 是 合并 和 混合 所 有 制 。 所 谓 合并 ， 
就 是 减少 国资 委 直接 管理 的 企业 ， 但 这 个 企业 仍然 存在 ， 如 果 有 问题 的 话 ， 
问题 也 仍然 存在 ， 只 不 过 把 管理 责任 推 给 了 另 一 个 国企 ， 向 下 推 了 一 个 层 
级 。 国 企 合并 实际 上 反映 了 在 现 有 技术 手段 下 ， 希 望 通过 减少 企业 数量 ， 
更 好 地 掌握 企业 实际 情况 的 需求 。 

国有 企业 管理 的 主要 问题 是 数量 多 、 层 级 多 、 信 息 不 对 称 。 国 有 企业 
的 数量 很 大 ， 政 府 无 法 直接 监管 。 企 业 合 并 后 ， 问 题 同样 存在 ， 只 不 过 下 
放 到 合并 的 总 公司 的 领导 层 ， 希 望 这 些 总 公司 的 管理 层 比 国资 委 更 加 接近 
企业 。 比 如 一 个 国企 总 经 理 原来 管 五 个 企业 ， 现 在 再 合并 来 五 个 企业 ， 他 
管 十 个 企业 。 五 个 企业 他 管 得 过 来 ， 十 个 企业 他 可 能 是 管 不 过 来 。 而 且 现 
在 国有 企业 的 层级 非常 多 ， 有 子 公司 、 孙 公司 、 曾 孙 公 司 ， 更 难以 管理 。 

大 量 、 多 层级 企业 的 管理 ， 需 要 利用 数据 技术 来 解决 。 利 用 数据 钻 取 
技术 查询 数据 , 不 管 多 少 层级 都 能 应 对 。 当 然 , 数据 技术 无 法 直接 进行 管理 ， 
更 无 法 直接 产生 效益 ， 但 可 以 掌握 详细 的 生产 经 营 信息 ， 便 于 发 现 问题 、 
分 析 问 题 、 解 决 问题 ， 以 做 出 正确 决策 ， 后 续 还 能 够 得 到 任何 一 个 决策 结 
果 的 及 时 、 准 确 的 反馈 。 

数据 技术 的 利用 ， 要 求 企业 信息 化 水 平 比较 高 ， 采 集 并 记录 有 大 量 数 
据 。 好 在 中 国 的 国有 企业 信息 化 水 平 要 比 民 营 企 业 高 。 现 在 许多 大 型 国有 
企业 都 统一 了 信息 系统 ， 比 如 总 公司 统一 部 署 了 SAP， 每 个 下 属 子 公司 都 
可 以 作为 用 户 使 用 ， 不 需要 每 个 子 公司 独立 部 署 一 套 系统 。 虽 然 这 种 模式 
对 利用 数据 最 理想 ， 但 因为 SAP 对 用 户 应 用 水 平和 资金 要 求 比较 高 ， 所 以 


不 是 所 有 国企 都 能 普及 。 

下 面具 体 介绍 一 下 利用 数据 技术 辅助 国有 大 型 企业 决策 的 方案 。 

国有 企业 拥有 包括 财务 、 供 应 链 的 信息 系统 ， 作 为 建立 数据 分 析 用 的 
数据 仓库 的 数据 源 ， 这 些 系统 的 供应 商 和 型 号 不 限 ， 可 以 是 SAP， 也 可 以 
是 用 友 、 人 金蝶 ， 如 果 是 用 友 软 件 ， 可 以 是 NC， 也 可 以 是 U9、U8&8。 

在 国企 总 公司 设立 一 个 数据 中 心 ， 把 分 布 在 不 同 子 公司 、 不 同 格式 数 
据 库 中 的 数据 通过 定时 抽取 的 方法 ， 放 到 数据 仓库 中 。 对 于 拥有 多 家 国有 
集团 公司 的 国资 委 ， 可 以 建立 自己 的 数据 仓库 ， 集 中 多 家 集团 公司 的 数据 ， 
也 可 以 通过 分 布 式 系统 ， 直 接 访问 在 各 集团 公司 的 数据 。 

有 了 数据 后 ， 分 析 方 法 不 是 传统 的 数据 浏览 或 数据 检索 。 这 些 方法 只 
适合 数据 很 少 的 小 企业 ， 大 企业 不 行 。 我 们 必须 通过 统计 汇总 的 分 析 方 式 ， 
用 汇总 数据 逐 级 钻 取 ， 才 能 发 现 问题 。 

假如 有 五 个 层级 的 企业 集团 ， 有 上 百 个 各 级 下 属 企业 ， 怎 么 样 发 现 问 
题 呢 ? 流程 是 这 样 的 : 

作为 总 公司 的 管理 者 在 经 营 概要 中 会 看 到 一 个 累计 销售 收入 、 累 计 销 
售 收入 的 增长 率 ， 销 售 收 入 和 增长 率 的 同比 增长 率 和 环比 增长 率 ， 这 是 最 
简单 的 数据 ， 这 个 数据 来 源 于 所 有 的 子 公司 、 孙 公司 的 累计 。 显 然 这 种 累 
计 可 以 进行 分 解 ， 先 分 解 到 子 公司 ， 比 如 说 有 十 家 子 公司 ， 看 一 下 十 家 子 
公司 的 销售 收入 增长 率 怎么 样 。 如 果 发 现 其 中 有 一 家 收入 下 降 了 ， 可 以 对 
这 家 公司 进行 钻 取 ， 看 一 下 这 家 子 公司 的 子 公司 的 经 营 数 据 。 假 如 还 有 十 
家 企业 ， 这 十 家 企业 哪 一 家 的 销售 收入 下 降 了 ， 十 家 企业 可 能 九 家 都 是 好 
的 ， 只 有 一 家 下 降 了 ， 那 么 可 以 再 对 这 家 和 孙 公 司 进行 分 析 。 我 们 来 详细 分 
析 这 家 孙 公 司 的 数据 ， 看 看 孙 公 司 里 面 到 底 是 哪个 区 域 或 者 哪个 产品 种 类 
的 销售 收入 下 降 了 。 最 后 我 们 看 到 可 能 有 一 个 产品 销售 收入 下 降 得 比较 多 。 

通过 类 似 以 上 的 数据 分 析 ， 我 们 分 析 众 多 的 企业 、 众 多 的 产品 。 如 果 
有 100 家 企业 ， 这 100 家 企业 每 家 有 10 个 产品 ， 那 就 累计 有 1 000 个 产品 。 
通过 数据 统计 分 析 可 以 用 非常 快 的 速度 找到 出 现 销售 收入 下 降 的 产品 。 找 
到 问题 所 在 后 ， 再 要 求 下 面 提交 这 个 产品 的 分 析 报 告 ， 要 求 这 个 公司 对 产 
品 销售 收入 下 降 的 原因 进行 详细 的 分 析 、 解 释 ， 并 且 提 出 整改 措施 。 过 一 
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段 时 间 以 后 ， 我 们 可 以 再 跟踪 这 个 产品 ， 看 它 的 销售 收入 是 不 是 有 所 好 转 。 
通过 这 样 的 方法 就 很 容易 对 众多 的 企业 进行 管理 ， 通 过 钻 取 从 众多 的 数据 
中 找到 需要 的 数据 。 


5.1.3 对 政府 “三 公 ” 经 费 管理 的 作用 


三 公 ” 经 费 是 指 财政 拨款 支出 安排 的 出 国境 ) 费 、 车 辆 购置 及 运 
行 费 、 公 务 接待 费 这 三 项 经 费 ， 这 是 公共 财政 控制 的 核心 。 由 于 这 三 项 费 
用 的 滥用 涉及 国家 党 政 机 关 的 公费 旅游 、 公 车 消费 、 公 款 吃 喝 等 不 良 行为 ， 
故 为 社会 普遍 关注 。 

通过 数据 可 以 寻找 到 解决 “三 公 ” 经 费 的 优化 控制 方案 。 

以 公务 车 的 运营 费 控制 为 例 。 公 车 运营 需要 油 费 、 过 路 费 及 维修 费 等 ， 
由 于 每 辆 车 出 行 的 里 程 不 同 、 车 辆 状况 不 同 ， 故 而 其 产生 的 费用 会 有 很 大 
的 差异 ， 而 在 这 其 中 就 会 有 漏洞 产生 ， 如 车 辆 维修 公司 侵吞 维修 费 等 。 由 
于 漏洞 巨大 ， 所 以 在 “三 公 ” 经 费 改 革 中 政府 把 公车 运营 作为 重点 。 目 前 
普遍 采用 方法 是 通过 发 放 补贴 取代 公车 运营 从 而 逐步 取消 公车 。 

用 补贴 代替 公车 仅仅 是 把 不 确定 的 费用 变 为 确定 的 费用 ， 而 实际 上 总 
的 费用 并 没有 降低 。 由 于 补贴 发 放 给 个 人 后 ， 用 车 成 为 个 人 支出 ， 相 关 人 员 
在 遇 到 非 必要 性 的 公务 活动 时 就 可 能 选择 不 去 ， 从 而 影响 工作 的 正常 开展 。 

取消 公车 、 发 放 补 贴 只 是 解决 这 个 问题 的 方法 之 一 ， 在 数据 时 代 可 以 
用 数据 来 解决 这 个 问题 。 第 一 ， 需 要 收集 公车 运营 的 费用 。 公 车 运营 费用 
必须 按照 财务 记 账 项 目 要 求 明确 记录 车 牌号 。 第 二 ， 和 凭证 明细 中 需 详细 列 
出 公车 的 运营 费用 ， 而 不 是 集中 多 个 单据 一 起 记 账 。 第 三 ， 公 开 公 车 运营 
数据 。“ 阳 光 是 最 好 的 防腐 剂 ”， 只 要 公开 公车 运营 数据 ， 那 么 所 有 的 问 
题 将 会 一 目 了 然 。 

比如 一 个 单位 有 10 辆 车 ， 若 把 10 辆 车 的 运营 维护 费用 公开 ， 可 以 按 
照 时 间 比 较 、 按 照 维修 科目 比较 、 按 照 维修 费 比 较 ， 这 其 中 的 区 别 就 能 很 
明显 地 被 看 出 来 。 

倘若 放眼 于 一 个 城市 ， 将 所 有 的 公车 进行 比较 并 由 财政 部 门 监控 ， 就 


会 对 每 辆 车 的 使 用 情况 有 一 个 宏观 的 了 解 ， 从 而 对 突出 事件 进行 控制 。 因 
为 所 谓 的 腐败 只 是 个 人 的 行为 ， 所 以 通过 比较 就 能 促使 问题 暴露 出 来 。 

更 为 复杂 的 解决 方案 是 专门 开发 出 一 个 公车 维护 数据 库 件 ， 将 公车 运 
行 里 程 、 维 护 费用 及 所 有 车 型 的 公车 零 部 件 的 价目 表 及 相关 内 容 都 存 入 这 个 
数据 库 中 ， 在 分 析 问 题 的 时 候 就 可 以 通过 这 个 数据 库 记 录 的 详情 进行 对 照 。 

使 用 鹰 眼 技术 ， 不 需要 将 每 个 零 部 件 进行 对 照 ， 而 只 要 财政 部 门将 所 
有 数据 集中 在 一 起 ， 然 后 对 所 有 车 辆 的 费用 合计 进行 比较 。 发 现 异 常 之 后 ， 
可 以 通过 数据 钻 取 追寻 其 根本 原因 ， 从 而 对 公车 维修 处 理 问 题 提出 意见 。 


5.1.4 对 “一 带 一 路 ”战略 的 作用 


国家 的 “一 带 一 路 ”战略 是 一 个 非常 宏伟 的 战略 ， 但 战略 的 实施 注定 
不 会 一 帆 风 顺 。 虽 然 一 切 刚刚 开始 ， 但 已 遇 到 一 些 挫折 ， 比 如 在 斯 里 兰 卡 
投资 的 机 场 没 有 航班 ， 在 战乱 的 叙利亚 收购 油田 ， 导 致 了 很 大 的 经 济 损失 。 
造成 损失 的 原因 除了 国企 管理 体制 有 一 些 问题 以 外 ， 主 要 就 是 对 沿线 国家 
的 情况 缺乏 充分 了 解 。 

西方 国家 在 全 球 化 的 过 程 中 ， 利 用 了 探险 家 和 传教 士 在 世界 各 地 收集 
的 信息 ， 虽 然 这 些 人 的 目的 是 探险 或 传教 ， 但 他 们 对 当地 人 文 、 地 理 的 了 
解 和 研究 ， 为 经 济 的 扩展 提供 了 很 多 的 有 价值 的 资料 。 

同样 地 ，“ 一 带 一 路 ”的 范围 是 如 此 之 大 ， 我 们 需要 掌握 的 信息 也 非 
常 多 。 当 然 ， 如 果 仅 仅 按 照 原 来 探险 家 的 模式 去 了 解 信息 ， 肯 定 既 无 必要 
也 不 足够 。 现 在 这 些 国 家 都 比较 开放 ， 交 通 也 非常 的 方便 ， 原 来 那些 探险 
家 需要 花费 很 长 时 间 ， 几 年 甚至 十 几 年 去 完成 的 工作 ， 现 在 坐 飞机 去 ， 几 
天 就 可 以 完成 了 。 

但 是 ， 仅 仅 拥有 这 些 信 息 是 不 够 的 。 我 们 需要 更 深入 的 信息 ， 更 深入 
的 信息 就 是 这 些 国家 政治 、 经 济 方面 的 数据 。 

比如 要 到 一 个 国家 去 投资 ， 以 斯 里 兰 卡 马 塔 拉 - 拉 贾 帕克 萨 国际 机 场 
为 例 ， 需 要 掌握 斯 里 兰 卡 的 经 济 总 量 、 经 济 的 分 布 、 人 口 的 分 布 、 运 输 量 
等 详细 数据 ， 而 不 仅仅 是 文字 报告 。 
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基于 这 样 的 思路 ， 需 要 把 建立 “一 带 一 路 ”数据 库 这 样 一 个 工作 放 到 
一 个 重要 的 位 置 上 来 ， 甚 至 放 在 所 有 的 投资 的 前 提 上 。 

但 是 ， 这 里 面 会 遇 到 两 个 问题 : 第 一 个 问题 就 是 这 些 国家 是 否 有 这 些 
数据 ;第 二 个 问题 就 是 它们 的 这 些 数据 愿 不 愿意 与 你 共享 。 

应 对 这 种 情况 ， 有 两 个 具体 方案 : 

第 一 个 方案 是 投资 信息 基础 设施 。 这 些 国 家 的 信息 化 水 平 比 较 低 ， 这 
种 低 正 好 给 我 们 带 来 新 的 投资 机 会 ， 也 就 是 说 我 们 可 以 通过 投资 带动 市 场 ， 
或 者 说 通过 贷款 来 推动 这 些 国家 的 信息 化 建设 ， 也 因此 可 以 在 这 些 国 家 搜 
集 更 多 的 数据 。 由 于 这 些 信 息 基础 设施 的 建设 是 我 国 投资 的 ， 可 以 签订 数 
据 共享 的 协议 。 

第 二 个 方案 是 数据 交换 。 出 于 数据 安全 的 考虑 ， 让 “一 带 一 路 ”沿线 
国家 无 偿 地 把 数据 给 我 们 共享 是 不 可 能 的 ， 只 有 进行 数据 交换 ， 就 像 现 在 
美国 和 它 的 盟国 会 进行 情报 交换 一 样 ， 我 们 可 以 把 中 国 的 经 济 数据 给 这 些 
“一 带 一 路 ”沿线 的 国家 ， 同 时 要 求 它们 也 提供 相同 类 型 数据 ， 达 到 与 它 
们 进行 数据 交换 的 目的 。 

这 两 个 方案 应 该 能 够 得 到 相关 国家 的 支持 ， 毕 竞 我 们 出 发 点 是 善意 的 ， 
主要 是 为 了 更 好 地 投资 和 加 强 它们 的 建设 ,或 者 是 为 了 把 有 限 的 资金 用 在 
最 合适 的 地 方 。 

“一 带 一 路 ”的 沿线 国家 的 数量 多 ， 信 息 基础 建设 比较 落后 ， 我 们 可 
以 在 信息 系统 的 软件 、 硬 件 、 网 络 等 各 个 方面 提供 一 个 完整 的 解决 方案 。 
这 一 方案 如 果 试 点 成 功 , 可 以 推广 到 其 他 的 国家 , 显然 既 为 我 们 “一 带 一 路 ” 
的 投资 包括 亚洲 基础 设施 投资 银行 提供 了 必要 的 数据 ， 同 时 又 开拓 了 一 个 
新 的 市 场 ， 相 对 于 高 铁 和 核能 ， 可 能 对 这 些 国 家 更 为 实用 。 

从 中 国 视角 看 ， 是 建设 智慧 城市 ， 放 眼 全 球 ， 可 以 上 升 到 智慧 国家 的 
建设 。 


5. 1.5 对 医疗 改革 的 作用 


医疗 改革 是 许多 国家 面临 的 一 个 重大 的 问题 ， 医 药 费用 是 社会 作为 公 


共 支 出 的 一 个 非常 大 的 陷阱 、 黑 洞 。 

关于 这 个 问题 ， 不 同 国家 探索 出 很 多 的 方案 来 。 比 如 美国 医疗 机 构 的 
完全 私有 化 、 英 国医 疗 机 构 的 全 部 公立 。 但 是 ， 这 些 方案 在 有 很 多 优点 的 
同时 又 存在 一 定 问题 ， 就 像 美 国 全 部 私有 化 ， 其 医疗 服务 无 疑 是 很 到 位 的 ， 
但 成 本 相对 非常 得 高 。 英 国 全 部 公有 化 ， 可 能 成 本 控制 得 很 好 ， 却 无 法 提 
高 服务 水 平 ， 造 成 很 多 的 病人 看 病 需要 排队 。 

所 以 ， 如 果 医 疗 改革 不 从 治疗 方案 的 监督 、 医 疗 的 运营 机 制 和 经 费 使 
用 这 些 方面 去 改革 ， 永 远 达 不 到 理想 的 效果 。 就 像 医生 寻找 研究 治疗 癌症 
的 方法 ， 如 果 总 想 通 过 随机 的 发 现 、 发 明 找到 治疗 癌症 的 药 是 很 困难 的 ， 
还 是 要 通过 基础 的 工作 ， 从 基因 测序 方面 去 系统 地 研究 问题 ， 才 能 找到 攻 
克 癌 症 的 方法 。 

同 理 ， 医 疗 改 革 还 需要 从 数据 的 收集 、 分 析 上 去 寻找 解决 问题 的 方法 。 
只 有 公开 医疗 数据 ， 比 如 一 个 人 生病 住院 期 间 的 治疗 、 药 品 费用 明细 ， 才 
能 通过 对 比分 析 发 现 医 疗 上 的 问题 ， 从 而 对 症 下 药 。 

目前 ， 中 国 的 大 多 数 医院 都 使 用 了 HIS 系统 ， 医 药 数据 完成 数字 化 ， 
而 且 部 分 做 到 费用 公开 ， 能 够 把 每 天 的 医药 费用 打印 出 清单 给 病人 。 

问题 是 ， 这 种 公开 还 是 形式 上 的 ， 对 控制 费用 作用 有 限 。 首 先 ， 病 人 
不 是 专家 ， 无 法 对 费用 的 高 低 做 出 判断 ， 其 次 ， 如 图 5-1 所 示 ， 提 供 的 数 
据 不 可 机 读 ， 无 法 用 信息 技术 手段 进行 横向 或 纵向 比较 。 

如 果 政 府 医疗 主管 部 门 能 拥有 所 有 医疗 数据 ， 并 且 可 以 对 数据 进行 深 
入 分 析 ， 则 可 以 有 针对 性 地 改革 ， 并 得 到 及 时 反馈 ， 医 药 费用 的 降低 是 比 
较 容 易 做 到 的 ， 改 革 的 效果 也 会 比较 明显 。 

现在 ， 国 家 也 在 建立 医院 数据 集中 式 的 一 个 平台 ， 但 在 数据 采集 的 技 
术 手 段 上 比较 落后 ， 基 本 是 通过 一 个 交换 标准 由 医院 报 送 数据 。 对 数据 的 
利用 还 存在 瓶颈 ， 有 了 数据 以 后 如 何 处 理 ， 还 没有 成 熟 的 手段 。 

政府 建设 的 数据 集中 平台 应 该 变 向 上 报 送 数据 为 向 下 抽取 数据 。 建 立 
区 域 的 数据 仓库 ， 可 以 以 地 级 市 为 单位 ， 然 后 把 医院 的 数据 通过 网 络 集中 
到 数据 仓库 。 医 院 的 信息 系统 是 独立 的 ， 使 用 何 种 HIS 系统 没有 限制 ， 医 
院 完 全 根据 业务 需要 来 购买 及 二 次 开发 。 医 疗 数据 中 心 通过 技术 手段 定期 
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\ 十 妖 器 海 “ 


(基本 上 每 天 一 次 ) 到 HIS 数据 库 中 提取 数据 ， 最 后 集中 到 数据 仓库 中 。 
在 抽取 及 保存 过 程 中 ， 对 一 些 数据 进行 转换 ， 使 医院 之 间 可 以 进行 横向 
比较 。 


出 院 病人 费用 明细 清单 
(六 位 匡 院 》 日 期 范围 : 从 a3-31 到 -lt 
; 散 叶 : OR 性 剂 ! 只 : 入 院 日 期 :- -31 15:09:0 。 科 党 :外 四 住 床位 ;: 
号 代码 名 称 /规格 标准 价 数量 单位 全 话 










下 本 QH50eg:5a145 支 / 僵 ) 





氨 甲 芋 县 《止血 芳 酸 》 针 /0.18:10al1 (5 安 / 仿 ) 支 
16 4015t 氨 甲 环 人 注射 蔗 /0. 58:5al 9.775 1 支 qTg 
[7 44031 ”是 地 毫米 丛 针 /5ag: 1al 0.559 18 支 10.07 
1 4080 重 记 人 展 岛 素 ( 普 通 优 洛 林 ) 注射 /400iu:10a1 0.15 212 iu 3 
19 47010 谁 生 妹 KI 针 /10ag:1s1(10 支 / 僵 ) 0.437 10 支 4 后 
Tt 惟 生 党 C 计 /0.5g:2a1(10 广 /人 ) 0.339 i | 
1 S0071 所 化 个 针 /0. 58:10m1(5 支 /全 ) 0.672 4 支 2 的 
0088 氧化 外 组 尾 片 /0. 5x124x2 极 0.23 1% 片 31.14 
3 W100 生化 鲜 针 10W10al 0.455 24 支 10.% 
对 50t10 氯 化 钠 针 /90me:10s1 0.409 1 支 0.4l 
fm 0 所 化 铺 什 ( 识 ) /IE:10al 0.627 0 支 25.12 
50l18 葵 春 糖 5%《〈 真 立 式 ) /100a1 4.232 4 是 16.92 
S0121 篇 辐 铺 10% (直立 式 》/3500sl 4.968 8 可 39.76 
项 芍 凡 5% 《直立 式 ) /250m1 452 pF 3 

4 小 


拨 化 局 0. 外 《直立 式 ) /1100ml 
注射 用 水 */500a1 

构 检 齿 坪 “可 堆 加 〉 颗粒 /1. 45#X20 委 
复方 氨基 般 /500a1 

蛋 前 乳剂 20M250a1 

开 训 器 /20s1 


ir 要 人 羽 提 供 参 元 ， 医保 俩 人 以 出 院 灿 贝 社 保 电驴 反馈 站 幅 单 为 准 | 
、 Ub ero . 
Nd 


5-1 出 院 病 人 费用 明细 清单 


国家 应 该 建立 一 个 分 布 式 的 数据 网 路 ， 可 以 从 各 个 地 级 市 数据 仓库 中 
提取 数据 进行 查询 。 数 据 可 以 提取 到 国家 中 心 的 数据 仓库 中 去 ， 也 可 以 只 
查询 结果 ， 对 结果 进行 比较 ， 而 不 提取 原始 数据 。 

目前 ， 医 疗 数据 中 心 建设 还 有 一 个 问题 ， 数 据 标准 交换 设计 的 数据 太 
多 ， 医 院 里 可 能 无 法 全 部 提供 。 实 际 上 ， 这 些 数据 不 一 定 要 马上 提供 ， 可 
以 在 使 用 中 不 断 完善 ， 制 订 一 些 政策 措施 ， 推 动 医院 根据 业务 发 展 来 完善 
这 些 数据 。 


比如 针对 某 一 项 数据 ， 有 一 个 民营 医院 ， 规 模 比 较 小 ， 业 务 中 或 信息 
系统 中 没有 涉及 或 保存 这 个 数据 ， 数 据 中 心 取 不 到 这 个 数据 。 取 不 到 这 些 
数据 就 不 取 ， 置 为 空 值 。 但 是 ， 如 果 监 管 工作 或 者 保险 公司 需要 这 个 数据 ， 
没有 这 个 数据 ， 保 险 公司 可 能 无 法 对 这 家 医院 的 医疗 项 目 进行 报销 ， 这 时 
这 个 医院 肯定 会 积极 展开 工作 ， 完 善 这 个 数据 。 如 此 一 来 ， 把 数据 的 完善 
作为 跟 业 务 紧 密 关联 的 一 种 工作 ， 而 且 是 一 个 逐步 完善 的 过 程 ， 可 以 降低 
数据 收集 的 门槛 。 

至 于 数据 存储 ， 医 院 的 数据 都 要 保持 最 原始 的 ， 而 且 这 个 数据 应 该 和 
医保 、 保 险 公 司 挂钩 ， 以 及 时 发 现 不 合理 的 消费 。 

在 地 区 数据 仓库 建立 后 ， 一 些 常 见 病 的 费用 很 容易 掌握 ， 但 有 些 很 少 
发 生 的 病例 成 本 就 难以 核算 了 。 在 全 国联 网 以 后 ， 毕 竟 全 国人 员 更 多 ， 在 
一 个 地 区 比较 稀罕 的 病例 ， 在 全 国 来 说 ， 可 能 是 一 个 发 生 次 数 比 较 频 繁 的 病 
例 ， 这 样 的 话 就 有 利于 比较 。 当 然 ， 这 个 比较 ， 并 不 是 要 降低 医院 的 利润 。 
按理 来 说 ,医院 的 利润 应 当 保 持 不 变 , 医生 的 收入 也 不 能 降低 , 但 要 核算 清楚 。 

在 数据 不 透明 的 情况 下 ， 好 像 医 院 的 医疗 收入 比较 低 ， 但 医院 通过 以 
药 养 医 ， 病 人 的 费用 还 是 越 来 越 高 。 这 种 不 透明 的 方式 对 经 济 是 非常 有 害 
的 ， 实 际 上 就 是 脱离 了 监管 ， 医 院 不 能 合法 地 获取 收益 ， 最 后 让 那些 钻 漏 
洞 的 人 得 到 了 好 处 。 


5.1.6 对 银行 信贷 风 控 的 作用 


银行 传统 贷款 ， 主 要 关注 两 个 方面 :一 个 是 查看 企业 的 经 营 报 表 ， 男 
一 个 查看 企业 的 抵押 资产 。 从 报表 的 角度 看 ， 在 不 诚信 的 环境 中 ， 报 表 可 
以 作假 ， 比 如 出 现 多 套 报 表 ， 一 套 对 税务 ， 另 一 套 对 银行 ;而 在 诚信 的 环 
境 中 ， 报 表 显 然 是 静态 信息 ， 不 能 及 时 预报 风险 。 

英国 《金融 时 报 》 网 站 2016 年 7 月 18 日 的 一 篇 文章 《金融 信息 不 可 
靠 困扰 中 国 经 济 》 就 痰 了 这 个 问题 : 


金融 信息 可 靠 性 的 全 面 崩溃 正在 加 剧 资本 错 配 ， 后 者 正 是 中 国 经 济 效 
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率 下 滑 、 公 司 债务 水 平 急 升 的 根源 所 在 。 例 如 ， 想 象 一 下 ， 假 如 一 家 中 国 
金融 机 构 考 虑 向 一 家 公司 放贷 ， 它 可 能 会 怎样 设法 找到 关于 这 家 公司 的 准 
确信 息 。 作 为 首选 ， 它 可 能 会 求助 媒体 报道 。 这 样 做 可 能 被 证 明 是 欠缺 考 
虑 的 。 这 家 机 构 找到 的 文章 可 能 已 经 受到 了 “有 偿 新 闻 ” 一 -在 新 闻 发 布 
会 上 将 现金 装 入 信封 塞 给 记者 以 换取 正面 报道 的 做 法 一 的 左右 。 

如 果 媒 体 不 可 信 ， 那 中 国 金融 机 构 还 能 指望 谁 呢 ”信用 评级 公司 是 一 
个 显而易见 的 选择 。 

充 州 煤 业 (Yanzhou Coal) 曾经 经 营 状况 优良 ， 眼 下 陷入 困境 ， 债 务 倍 
数 舰 升 。 该 公司 去 年 资产 收益 率 仅 揭 强 维持 在 0.1%， 中 国 评 级 机 构 却 给 
出 最 高 级 别 的 信用 评级 。 相 比 之 下 ， 国 际 评级 机 构 标 准 普尔 (Standard 多 
Poor' s) 给 该 公司 的 评级 为 “垃圾 级 ”。 类 似 的 例子 还 有 很 多 。0 


在 数据 时 代 ， 只 有 我 们 把 所 有 的 企业 经 营 数据 都 公开 ， 银 行 才能 保证 
贷款 企业 数据 的 准确 性 。 首 先 ， 伪 造 一 个 数据 容易 ， 而 伪造 一 串 数据 而 且 
是 相互 关联 的 数据 则 非常 困难 了 ; 其 次 ， 数 据 的 公开 有 利于 银行 动态 监控 
企业 的 状况 ， 能 比较 准确 地 掌握 企业 的 运营 情况 和 资金 流向 ， 最 大 限度 地 
规避 风险 ， 比 单 看 报表 要 可 靠 得 多 。 

从 资产 抵押 方面 看 ， 资 产 抵 押 相 对 而 言 是 一 种 比较 笨 的 方法 ， 在 出 现 
坏账 时 ， 资 产 变现 十 分 困难 。 抵 押 资 产 增加 了 企业 贷款 的 门槛 ， 有 些 做 得 
好 的 企业 并 不 一 定 拥 有 很 多 可 抵押 资产 ， 这 样 容 易 把 优良 的 企业 拒 之 门 外 。 
因此 ， 基 于 数据 和 公司 供应 链 及 现金 流 的 监控 ， 能 够 部 分 解决 中 小 企业 贷 
款 难 问题 。 

从 供应 链 贷款 的 角度 来 看 ， 通 过 对 核心 企业 采购 数据 的 把 控 ， 可 以 对 
属于 核心 企业 的 供应 商 提供 供应 链 贷款 。 原 来 供应 链 贷款 可 能 需要 对 核心 
企业 提出 很 多 要 求 ， 甚 至 部 署 专 门 的 信息 系统 ， 不 然 难以 获取 这 类 数据 ， 
而 采用 现在 的 数据 技术 ， 如 果 能 直接 从 它 的 ERP 中 获取 数据 ， 就 可 以 极 大 
地 减轻 核心 企业 的 负担 。 由 于 核心 企业 不 需要 额外 做 什么 事情 ， 只 需要 开 
放 ERP 的 数据 访问 权限 即 可 ， 从 而 大 大 降低 了 供应 链 融 资 的 推广 门槛 。 

下 面 详细 介绍 一 下 利用 数据 进行 供应 链 融 资 的 方法 。 


银行 的 贷款 常常 需要 抵押 ， 信 用 贷款 比较 少 ， 基 于 信用 和 抵押 之 间 现 
在 比较 重视 供应 链 的 融资 ， 但 供应 链 的 融资 涉及 核心 企业 数据 的 获取 。 由 
于 企业 供应 链 的 融资 受 惠 的 主要 是 核心 企业 的 供应 商 而 不 是 自身 ， 核 心 企 
业 对 此 兴趣 不 是 很 大 。 有 的 银行 觉得 ， 可 以 通过 给 核心 企业 分 成 来 提高 核 
心 企业 的 积极 性 ， 但 实际 上 每 个 核心 企业 都 有 自己 的 盈利 模式 ， 如 果 它 过 
于 关注 供应 链 融资 的 分 成 ， 就 变 成 多 种 经 营 了 ， 因 此 公司 层面 不 会 很 重视 。 
如 果 供 应 链 融资 还 要 求 核心 企业 为 此 专门 配置 一 套 信息 系统 ， 那 么 门槛 就 
更 高 了 ， 因 为 一 家 企业 使 用 一 套 信息 系统 的 成 本 是 非常 高 的 ， 不 但 要 有 人 
维护 还 要 有 人 输入 数据 。 虽 然 这 其 中 会 对 它 产 生 价值 ， 但 毕竟 企业 最 关注 
的 是 自己 的 核心 业务 。 因 此 ， 现 在 最 好 的 方法 是 对 核心 企业 不 提 什 么 要 求 ， 
而 是 利用 它 现 有 的 信息 系统 的 数据 来 实现 供应 链 融 资 。 

众所周知 ， 能 成 为 一 个 核心 企业 ， 肯 定 是 经 济 效益 和 管理 水 平 比较 高 
的 企业 ， 这 种 企业 一 般 都 有 ERP 系统 ， 而 ERP 系统 里 就 包括 它 的 采购 方 
的 采购 信息 、 发 货 信 息 及 它 的 付款 信息 ， 所 以 只 要 能 从 ERP 中 抽取 数据 ， 
就 可 以 监控 到 它 的 供应 商 的 货物 和 资金 的 来 往 情 况 ， 达 到 保障 资金 安全 的 
目的 。 

供应 方 的 融资 有 两 种 方式 。 一 种 方式 是 希望 由 核心 企业 来 担保 ， 也 就 
是 说 核心 企业 付 给 供应 商 的 钱 受到 银行 的 监控 ， 这 样 即使 供应 商 企业 有 问 
题 ， 这 笔 钱 可 以 被 银行 扣留 ， 但 这 种 方式 对 核心 企业 提出 了 新 的 要 求 ， 增 
加 了 业务 开展 的 门槛 。 另 外 一 种 方式 则 比较 简单 ， 不 需要 管 资金 ， 只 要 监 
控 数 据 即 可 控制 风险 。 

实际 上 ， 任 何 一 家 企业 出 现 经 营 上 的 困境 不 是 一 两 天 的 事情 ， 它 有 一 
个 酝酿 的 过 程 ， 只 要 你 监控 核心 企业 的 数据 ， 这 个 过 程 发 展 趋势 是 非常 明 
显 的 。 比 如 说 一 个 供应 商 如 果 经 营 状 况 在 恶化 的 话 ， 核 心 企业 会 逐渐 减少 
对 它 的 采购 ， 而 供应 商 的 发 货 周期 也 会 延长 ， 核 心 企业 在 对 供应 商 的 付款 
上 也 会 出 现 异 常 ， 所 有 这 些 信息 实际 上 核心 企业 的 采购 人 员 心 里 是 知道 的 。 

既然 我 们 要 采用 大 数据 去 实现 供应 链 融资 ， 就 不 需要 经 常 要求 核 心 企 
业 采 购 人 员 评 估 这 些 供应 商 ， 而 可 以 通过 数据 的 监控 发 现 供应 商 的 数据 异 
常 。 比 如 说 ， 核 心 企业 对 该 供应 商 的 同比 采购 数量 下 降 或 者 是 环比 下 降 很 
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多 ， 就 应 该 立即 引起 重视 ， 然 后 在 贷款 的 清 收 上 或 下 一 笔 贷款 的 发 放 上 采 
取 谨慎 的 措施 ;或 者 在 发 现 数据 异常 以 后 ， 马 上 向 核心 企业 的 采购 人 员 了 
解 信息 ， 得 到 一 些 更 准确 的 反馈 ， 防 止 误 判 。 

银行 可 以 请 求 核 心 企业 对 ERP 数据 进行 开放 ， 银 行 通 过 远程 看 到 数据 
分 析 的 结果 。 为 了 安全 起 见 ， 可 以 只 开放 采购 和 应 付款 的 数据 ， 对 企业 的 
其 他 数据 一 概 屏蔽 。 核 心 企业 可 以 通过 对 数据 权限 的 设置 来 防止 其 他 数据 
的 泄密 。 另 外 ， 也 可 以 由 银行 提供 名 单 ， 核 心 企业 对 名 单 上 的 供应 商 开 放 
数据 ， 以 此 保证 数据 的 安全 。 一 般 来 说 ， 企 业 对 自己 销售 的 客户 和 销售 的 
数据 比较 关注 ， 对 安全 性 比较 重视 ， 但 对 采购 的 数据 相对 而 言 不 太 重视 ， 
除非 一 些 核心 的 供应 商 ， 但 现在 这 种 供应 商 在 企业 中 的 数量 还 是 比较 少 的 ， 
大 部 分 都 是 一 些 比较 大 众 的 供应 商 。 


5. 1.7 对 降低 社会 成 本 的 作用 


中 国 要 跨越 中 等 收入 陷阱 ， 进 入 发 达 国 家 行列 ， 必 须 在 提高 人 力 成 本 
的 前 提 下 降低 其 他 成 本 。 中 国 过 去 三 十 多 年 的 发 展 ， 是 以 廉价 的 人 力 成 本 
掩盖 了 其 他 众多 高 昂 的 成 本 。 以 美国 为 首 的 西方 发 达 国家 ， 实 际 上 在 人 力 
资本 外 ， 也 拥有 很 多 的 成 本 优势 ， 中 国 不 做 深层 次 的 改革 这 将 成 为 跨 入 发 
达 国 家 的 主要 障碍 。 这 种 改革 的 成 功 除 改革 的 意愿 、 改 革 思 路 、 改 革 执 行 
力 外 ， 更 需要 对 改革 进展 和 结果 的 掌握 。 

是 否 要 改革 ， 如 何 改 革 ， 表 面 上 体现 的 是 政治 意愿 ， 实 际 上 通过 数据 
可 以 准确 反映 改革 的 必要 性 和 改革 的 效果 。 如 果 改 革 仅 靠 专家 和 媒体 的 呼 
吁 ， 由 于 他 们 得 到 的 信息 不 完整 ， 而 代表 被 改革 者 利益 的 业内 人 士 掌握 的 
数据 比较 具体 ， 所 以 开会 讨论 时 ， 只 要 他 们 摆 几 个 具体 问题 而 又 没有 对 策 ， 
决策 层 就 会 犹豫 ， 导 致 改革 停摆 。 

发 起 改革 的 理由 和 改革 后 的 效果 ， 都 要 有 基于 数据 有 说 服 力 的 证 据 ， 
才能 得 出 社会 共识 。 比 如 说 垄断 ， 需 要 公开 垄断 企业 的 运营 数据 : 它 的 成 
本 发 生 在 哪里 ? 利润 在 哪里 ? 效益 在 哪里 ? 人 均 效 率 在 哪里 ? 对 数据 进行 
分 析 , 把 数据 和 国内 外 同行 进行 比较 , 从 而 发 现 问题 在 哪里 ? 哪里 成 本 偏 高 ? 


比如 一 个 城市 的 自来水 公司 ， 它 的 供水 成 本 有 人 反映 比较 高 ， 等 到 具 
体 研究 降价 的 时 候 ， 自 来 水 公司 在 会 议 上 会 拿 出 证 据 证 明 它 是 微利 甚至 是 
亏损 ， 这 样 将 无 法 说 服 领导 对 价格 进行 调整 。 如 果 开 听 证 会 ， 市 民 代表 手 
里 没有 数据 ， 只 能 听从 一 面 之 词 ， 最 后 听证 会 都 开 成 涨 价 会 。 如 果 这 个 自 
来 水 公司 能 够 把 它 的 运营 成 本 公开 ， 实 际 运营 的 盈利 情况 公开 ， 关 键 成 本 
开支 是 否 合理 ， 将 会 一 目 了 然 。 

如 果 全 国 所 有 城市 的 运营 成 本 都 公开 ， 不 同 的 地 区 显然 会 存在 差异 ， 
比如 采购 价格 的 差异 。 但 通过 横向 比较 ， 一 方面 能 明显 地 看 出 哪些 城市 成 
本 支出 不 合理 ， 揭 开 那 些 虚 高 运营 成 本 的 面纱 ; 另 一 方面 也 能 够 让 运营 公 
司 看 到 自身 的 不 足 从 而 进行 调整 ， 使 全 国 的 供水 成 本 均衡 化 ， 不 给 个 别 企 
业 获 取 暴 利 的 可 能 性 。 国 家 也 因此 能 制定 一 个 公用 事业 平均 的 毛利 标准 ， 
让 企业 有 一 个 合理 利润 ， 保 证 其 正常 运营 。 

数据 公开 还 可 以 揭露 垄断 行业 的 费用 在 整个 社会 成 本 中 的 比例 。 通 过 
成 本 的 公开 ， 可 以 发 现 商场 一 件 衣服 的 成 本 构成 、 可 以 分 析出 地 价 在 这 其 
中 累积 的 占 比 ， 看 到 政府 由 于 累积 的 收费 最 后 进入 财政 的 钱 的 占 比 。 

通过 这 种 对 复杂 产业 链 的 跟踪 揭露 它 的 主要 成 本 ， 相 关 问 题 凸显 ， 并 
且 也 很 容易 与 社会 形成 共识 。 在 这 种 的 情况 下 再 去 谈 改革 ， 比 较 容 易 得 到 
大 家 的 认可 。 

由 于 这 些 数据 与 改革 的 措施 有 很 大 关联 ， 可 以 明确 地 测算 出 改革 可 以 
取 到 的 效果 ， 最 后 可 以 根据 数据 看 出 改革 的 结果 和 改革 的 预期 是 否 相符 。 

比如 ， 现 在 绝 大 多 数 人 对 高 房价 持 反 对 态度 ， 但 有 些 人 认为 高 房价 带 
动 了 产业 链 的 发 展 ， 促 进 了 就 业 。 这 里 有 一 个 主要 的 研究 课题 是 : 高 房价 
带 来 的 就 业 和 贡献 与 它 带 来 的 危害 之 间 的 比较 。 这 是 一 个 很 复杂 的 课题 ， 
但 通过 数据 的 研究 可 能 会 发 现实 际 上 高 房价 的 危害 远 远 大 于 它 带 来 的 对 社 
会 的 效益 ， 因 为 我 们 每 个 人 在 生活 消费 中 都 在 为 高 房价 付款 。 

如 果 研 究 美 国 经 济 ， 可 以 发 现 这 样 一 个 链条 : 物价 低 是 因为 商业 房租 
低 ， 房 租 低 是 因为 汽车 使 用 成 本 低 〈 没 有 或 低 过 路 费 、 低 汽油 价格 )。 原 
来 我 们 总 认为 美国 是 “汽车 上 的 社会 ”， 它 的 低 油价 会 造成 资源 的 浪费 ， 
却 没有 看 到 它 对 降低 成 本 的 作用 。 
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5. 1.8 对 防止 欺诈 上 市 的 作用 


建立 健康 发 展 的 证 券 市 场 ， 推 动 企 业 直接 融资 ， 对 中 国 实体 经 济 的 发 
展 至 关 重 要 。 信 息 是 证 券 市 场 赖 以 生存 的 基础 。 为 消除 信息 不 对 称 对 投资 
者 造成 的 侵害 ,各国 均 制定 了 相关 的 法 律 法 规 ， 强 制 信息 持 有 者 进行 公开 ， 
并 辅 之 以 相应 的 法 律 责 任 。 欺 诈 上 市 的 行为 在 证 券 市 场 上 屡禁不止 ， 严 重 
损害 了 市 场 的 正常 运行 和 投资 者 的 利益 。 

在 监管 层 的 券商 风 控 新 规 要 求 下 ， 一 旦 出 现 欺 诈 发 行 或 信 披 违规 ， 保 
荐 券商 或 将 承担 较 大 的 连带 责任 ， 因 此 各 券商 都 很 重视 风险 管理 。 

风险 管理 的 基本 程序 是 风险 识别 、 风 险 评估 、 风 险 应 对 ， 而 三 者 都 是 
建立 在 信息 搜集 的 基础 之 上 的 。 如 果 无 法 搜集 到 有 效 的 信息 ， 整 个 风险 管 
理 体系 就 会 失效 。 

尽职 调查 是 IPO 项 目 风险 管理 的 关键 ， 尽 职 调查 是 整个 IPO 业务 风险 
集聚 的 环节 ， 风 险 点 众多 。 财 务 尽 职 调查 是 尽职 调查 的 关键 。 

尽职 调查 的 重大 风险 包括 持续 经 营 风险 、 税 收 风 险 、 关 联 方 交易 风险 、 
舞弊 风险 、 战 略 经 营 风险 、 独 立 性 风险 等 。 

财务 尽职 调查 要 识别 出 虚 增 收入 、 虚 增 利润 、 关 联 交 易 等 风险 点 。 

现在 的 尽职 调查 因为 无 法 通过 对 企业 的 财务 凭证 数据 、ERP 进 销 存 数 
据 进行 详细 分 析 , 很 多 工作 只 能 手工 进行 , 从 外 围 入 手 , 不 但 数据 准确 性 差 ， 
而 且 耗 时 太 长 ， 一 般 都 要 半年 左右 。 

在 数据 时 代 ， 可 以 实现 从 宏观 到 微观 ， 即 从 行业 到 业务 ， 再 到 财务 的 
分 析 。 行 业 分 析 数 据 来 自 对 已 上 市 的 同行 公司 的 财务 数据 分 析 ， 业 务 分 析 
数据 来 自 企 业 ERP 数据 ， 可 对 企业 供应 链 的 经 营 数据 分 析 ， 财 务 分 析 数 据 
来 自 财务 软件 。 这 样 ， 可 以 减轻 尽职 调查 工作 的 难度 和 强度 ， 减 少 尽职 调 
查 的 人 员 数 量 ， 大 幅 缩 短 尽职 调查 时 间 ， 从 而 收集 企业 更 多 的 有 效 信息 ， 
识别 更 多 可 能 的 风险 点 。 

在 拥有 这 些 数据 后 ， 具 体 如 何方 便 地 找到 风险 点 呢 ? 

对 于 利用 虚假 交易 虚 增 收入 ， 可 以 : 包 通 过 对 合同 金额 的 排名 ， 和 同 
比 排名 ， 找 到 异常 交易 ;，@ 通 过 分 月 、 分 日 销售 金额 对 比 ， 在 应 该 比较 均 





匀 的 金额 中 ， 发 现 异 常 交 易 的 存在 ， 再 通过 数据 钴 取 和 销售 明细 找到 异常 
交易 。 虚 增收 入 可 能 体现 在 某 几 日 收入 太 高 ，@ 通 过 对 平均 最 高 单价 分 析 ， 
发 现 抬 高 单价 的 异常 交易 ;四 通过 对 销售 业务 流程 各 环节 对 应 关系 ， 如 出 
库 数量 、 发 票 金额 、 应 收 款 金额 、 收 款 金 额 的 关联 性 分 析 ， 发 现 异 常 交易 
@ 对 企业 提交 的 利润 表 中 营业 收入 和 自动 从 财务 凭证 中 生成 利润 表 营 业 收 
入 进行 比较 。 

对 于 虚构 利润 ， 可 以 : 中 将 财务 分 析 中 主 营 业务 毛利 和 经 营 分 析 中 的 
毛利 进行 比较 ; 四 比较 同行 业 上 市 公司 的 毛利 率 、 存 货 周转 率 、 财 务 费用 
率 等 数据 ， 发 现 隐藏 财务 费用 等 的 线索 ，@ 按 时 间 维 度 观察 对 主要 客户 或 
供应 商 的 销售 和 采购 平均 单价 ， 是 否 和 其 他 供应 商 的 平均 单价 比较 过 高 或 
过 低 。 


5.2 数据 革命 的 后 果 


大 数据 成 为 提升 政府 治理 能 力 的 新 途径 。 大 数据 应 用 能 够 揭示 传统 技 
术 方式 难以 展现 的 关联 关系 ， 推 动 政府 数据 开放 共享 ， 促 进 社会 事业 数据 
融合 和 资源 整合 ， 将 极 大 提升 政府 整体 数据 分 析 能 力 ， 为 有 效 处 理 复杂 社 
会 问题 提供 新 的 手段 。 建 立 “ 用 数据 说 话 、 用 数据 决策 、 用 数据 管理 、 用 
数据 创新 ”的 管理 机 制 ， 实 现 基于 数据 的 科学 决策 ， 将 推动 政府 管理 理念 
和 社会 治理 模式 进步 ， 加 快 建设 与 社会 主义 市 场 经 济 体制 和 中 国 特 色 社 会 
主义 事业 发 展 相 适 应 的 法 治政 府 、 创 新 政府 、 廉 洁 政府 和 服务 型 政府 ， 逐 
步 实现 政府 治理 能 力 现代 化 。 





国务 院 《 促 进 大 数据 发 展 行动 纲要 》 


5. 2. 1 “竞争 机 制 的 奉 代 


西方 经 济 几 百 年 来 得 到 迅速 发 展 ， 这 与 它 的 市 场 经 济 制度 设计 有 关 。 
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这 种 设计 包括 有 限 公司 的 设计 、 市 场 竞 争 机 制 的 设计 ， 都 是 非常 有 效 的 手 
段 。 应 该 说 ,市场 竞争 是 在 当时 的 技术 条 件 下 最 佳 的 运作 模式 。 

到 了 数据 时 代 ， 这 种 模式 会 不 会 有 变化 呢 ? 应 该 说 会 发 生变 化 ， 市 场 
竞争 将 不 再 是 资源 配置 的 最 佳 方式 ， 起 码 不 是 唯一 的 方式 。 

市 场 竞争 有 很 多 的 局 限 性 ， 而 且 为 了 避免 这 种 局 限 性 ， 人 们 也 做 了 很 
多 努力 ， 比 如 说 通过 兼并 来 避免 恶性 竞争 。 两 个 企业 如 果 处 于 竞争 状态 ， 
虽然 价格 很 低 ， 但 因为 市 场 部 是 重复 设置 的 ， 对 社会 来 说 是 浪费 的 。 企 业 
通过 兼并 来 解决 市 场 竞争 低下 的 问题 ， 也 就 是 通过 兼并 把 两 个 市 场 部 合成 
一 个 市 场 部 ， 保 留 不 同 的 产品 部 ， 以 提高 效率 。 

但 兼并 又 可 能 形成 荤 断 ， 为 避免 垄断 带 来 的 高 价格 ， 国 家 又 制定 了 反 
垄断 法 。 

市 场 竞争 是 有 成 本 的 。 现 在 有 很 多 的 广告 ， 一 类 广告 是 以 产品 信息 为 
目的 ， 这 是 必须 的 ; 另 一 类 仅 为 竞争 的 目的 ， 就 是 浪费 。 

能 不 能 有 一 种 既 能 达到 竞争 的 目的 ， 又 能 避免 竞争 的 浪费 的 方法 ? 
利用 数据 可 以 做 到 。 通 过 数据 的 公开 和 数据 的 分 享 ， 可 以 减少 竞争 的 负面 
作用 。 

下 面 分 析 一 下 竞争 有 效 性 的 原因 。 由 于 信息 不 透明 ， 消 费 者 很 难 知道 
一 个 产品 的 真正 的 、 合 理 的 成 本 是 多 少 ， 所 以 无 法 对 售 价 提出 要 求 。 只 有 
通过 竞争 ， 也 就 是 说 另外 一 个 厂家 生产 同样 的 产品 ， 它 的 价格 如 果 能 降低 
的 话 ， 就 能 证 明 原 来 的 厂家 价格 也 能 降低 ， 消 费 者 因此 知道 了 一 个 产品 可 
以 达到 的 最 低 价格 。 由 于 很 多 消费 者 转 为 选择 新 厂家 、 新 产品 ， 迫 使 老 厂 
家 降低 售 价 。 如 果 老 厂家 确实 由 于 生产 率 低 下 无 法 降价 ， 就 只 有 破产 。 

如 果 有 一 个 非常 公开 的 成 本 架构 ， 消 费 者 可 以 知道 它 的 真实 成 本 ， 也 
可 以 有 效 地 降低 产品 价格 ， 产 生 跟 竞争 类 似 的 效果 。 厂 家 知道 业内 最 优 的 
成 本 构成 ， 也 可 以 及 时 发 现 问 题 ， 提 高 效率 ， 或 及 时 转移 产能 。 现 在 一 些 
事业 单位 或 垄断 企业 由 于 它 的 成 本 没有 公开 ， 也 没有 合理 竞争 ， 会 受到 公 
众 的 压力 ， 如 果 它 的 成 本 结构 能 够 公开 ,而且 利润 合理 的 话 ， 压 力 会 减 小 ， 
如 果 成 本 确实 过 高 ， 则 通过 公众 的 压力 或 者 政治 上 的 压力 也 可 以 迫使 它 降 
低 成 本 ， 从 而 降低 社会 成 本 。 


5.2.2 计划 经 济 和 市 场 经 济 的 融合 


计划 经 济 由 政府 对 经 济 进行 集中 掌控 ， 政 府 占 有 、 经 营 土 地 和 经 济 生 
产 的 资本 、 资 料 ， 在 20 世纪 30 年 代 一 20 世纪 80 年 代 ， 都 认为 计划 经 济 
是 比 市 场 经 济 更 有 效率 、 更 公平 的 经 济 生 产 形态 ， 由 政府 集中 控制 经 济 管 
理 和 企业 决策 比分 散 的 经 济 秩序 更 有 效率 。 

市 场 经 济 由 私人 占有 生产 资料 ， 私 人 组 织 生产 活动 ， 生 产 经 营 活动 是 
建立 在 提供 和 利用 零碎 而 分 散 的 信息 基础 上 ， 价 格 和 利润 传递 着 各 种 商品 
和 服务 的 相对 供需 状况 。 

现在 一 个 国家 的 经 济 制度 基本 介 于 计划 经 济 和 市 场 经 济 之 间 。 将 倾向 
计划 经 济 的 政党 称 为 左翼 政党 ， 倾 向 市 场 经 济 的 政党 称 为 右翼 政党 ， 还 有 
很 多 持 中 间 立 场 的 政党 。 

一 个 国家 的 经 济 最 好 要 像 汽车 一 样 ， 行 驶 在 路 中 央 ， 而 实际 上 不 是 偏 
左 ， 就 是 偏 右 。 在 西方 国家 ， 一 个 左翼 政党 执政 久 了 ， 就 会 偏 左 ， 如 果 经 
济 出 了 问题 ， 选 民 就 会 拥护 右翼 政党 上 人 台 ， 右 翼 政 党 肯定 偏 右 ， 开 始 正好 
纠正 了 “左倾 ”的 错误 ， 经 济 会 不 断 变 好 ， 但 慢 慢 就 偏离 了 中 间 ， 开 始 问 
题 不 大 ， 但 慢 慢 就 出 了 问题 ， 要 想 纠正 右倾 的 错误 ， 只 有 让 左翼 政党 上 台 。 
如 此 往复 ， 经 济 就 像 汽 车 ， 不 断 向 前 行驶 。 

在 第 二 次 世界 大 战 结束 后 ， 由 于 战 时 经 济 被 管制 ， 生 产 采 用 计划 经 济 ， 
加 上 苏联 由 于 实行 计划 经 济 表现 出 整体 实力 ， 所 以 很 多 欧洲 国家 都 倾向 于 
计划 经 济 ，“ 左 倾 ” 政 府 得 势 。 到 20 世纪 80 年 代 ， 由 于 西欧 经 济 衰退 以 
及 苏联 机 制 暴露 出 的 问题 ， 致 使 英国 撤 切 尔 夫人 和 美国 里 根 总 统 进行 了 私 
有 化 和 放松 管制 的 改革 ， 转 向 右倾 。 

计划 经 济 的 优点 是 由 政府 掌握 生产 资料 ， 通 过 计划 指导 生产 ， 优 势 是 
可 以 科学 规划 ， 总 体 调 度 ， 避 免 私 人 无 序 竞争 ， 劣 势 是 由 于 经 济 的 复杂 性 ， 
决策 者 知识 的 局 限 性 ， 导 致 生 产 效 率 的 实际 下 降 。 哈 耶 克 认为 知识 分 散在 
所 有 人 的 头脑 中 ， 这 些 零 散 的 知识 不 可 能 被 汇集 到 一 个 人 的 头脑 中 。"™ 

市 场 经 济 由 资本 家 根据 价格 和 利润 信号 组 织 生 产 ， 但 由 于 信息 的 不 对 
称 和 消费 者 的 不 理性 ， 这 种 信号 传导 常常 会 出 错 ， 因 此 市 场 经 济 也 存在 大 
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量 资源 错 配 ， 经 济 危 机 就 是 调整 这 种 资源 错 配 的 机 制 ， 但 经 济 危机 的 发 生 
也 导致 大 量 社会 资源 的 浪费 ， 甚 至 导致 政治 危机 。 

寻求 计划 经 济 和 市 场 经 济 之 间 的 中 间 道 路 ， 是 很 多 知识 分 子 和 政党 的 
追求 ， 但 在 数据 时 代 之 前 ， 由 于 缺乏 有 效 技术 手段 ， 并 没有 找到 合适 的 解 
决 方法 ， 而 数据 革命 ， 为 计划 经 济 和 市 场 经 济 的 融合 创造 了 条 件 。 

数据 革命 将 收集 海量 数据 ， 并 将 这 些 数据 提供 给 市 场 参与 者 ， 而 决策 
支持 系统 的 建设 使 这 些 参与 者 可 以 利用 各 自 的 专业 知识 理解 数据 中 包含 的 
信息 ， 从 而 做 出 正确 的 决策 。 有 了 这 些 信息 ， 既 可 避免 信息 的 不 对 称 ， 又 
可 避免 个 人 的 不 理性 ， 彻 底 解决 了 市 场 经 济 的 短 板 ， 从 而 把 计划 经 济 的 长 
处 利用 起 来 。 

这 样 ， 计 划 经 济 不 再 是 中 央 计划 制订 部 门 部 分 人 拟订 的 计划 ， 而 是 一 
种 分 布 式 的 有 很 多 人 参与 的 计划 ， 比 市 场 经 济 中 价格 及 利润 信号 更 为 准确 、 
及 时 、 全 面 。 


5.2.3 经 济 危 机 的 消除 


经 济 危机 不 是 坏事 ， 当 经 济 存在 泡沫 的 时 候 ， 和 危机 是 有 利于 返回 经 济 
均衡 状态 的 一 个 工具 。 如 果 像 日 本 逝去 的 20 年 一 样 ， 在 泡沫 积累 以 后 没 
有 及 时 去 消除 ， 亏 损 企业 没有 退出 市 场 ， 而 是 靠 银行 输血 维持 ， 造 成 的 损 
失 更 大 。 经 济 危 机 应 该 是 数据 时 代 以 前 的 一 个 产物 ， 在 数据 革命 成 熟 以 后 ， 
这 种 危机 应 该 不 会 存在 。 

危机 产生 的 一 个 原因 就 是 无 法 获取 权威 的 、 准 确 的 数据 ， 无 法 判断 在 
某 一 个 领域 投资 是 否 恰当 。 

一 个 领域 的 投资 总 是 以 下 四 种 状态 之 一 : 一 是 不 足 、 二 是 恰好 、 三 是 
过 剩 、 四 是 泡沫 。 投 资 处 在 恰好 状态 的 时 间 是 很 短 的 ， 大 多 时 间 不 是 不 足 ， 
就 是 过 剩 ， 过 度 过 剩 状 态 就 是 泡沫 。 然 而 ， 目 前 是 什么 状态 ， 是 否 已 经 投 
资 过 剩 成 为 泡沫 ， 人 们 通常 无 法 判断 。 由 于 大 家 得 知 的 信息 比较 片面 ， 容 
易 造 成 大 家 都 向 一 个 领域 投资 ， 从 而 产生 泡沫 。 

在 数据 时 代 ， 由 于 信息 多 样 化 ， 大 家 获取 信息 的 成 本 比较 低 ， 而 且 只 


要 有 一 定 的 专业 知识 ， 花 一 定 的 功夫 就 可 以 准确 地 了 解 这 方面 的 信息 ， 所 
以 大 家 的 投资 就 会 比较 分 散 ， 而 且 效益 比较 高 ， 不 会 集中 涌 在 泡沫 所 在 的 
区 域 ， 这 样 就 能 够 消除 经 济 危 机 产生 的 根源 ， 即 投资 的 泡沫 。 


5.3 数据 革命 后 的 技术 


5.3.1 以 数据 检索 为 主 的 搜索 引擎 


以 谷歌 、 百 度 为 代表 的 搜索 引擎 ， 无 论 是 技术 还 是 商业 模式 都 比较 成 
熟 ， 下 一 步 该 如 何 发 展 呢 ? 

现在 搜索 引擎 主要 是 搜索 网 上 的 网 页 ， 就 是 对 非 结构 化 的 数据 进行 搜 
索 ， 然 后 跳 转 到 相关 的 网 页 上 。 

从 数据 含金量 的 指标 分 析 ， 网 页 数据 的 含金量 比较 低 。 在 数据 时 代 到 
来 以 后 ， 许 多 互联 网 资源 应 该 转变 为 数据 资源 ， 这 样 含金量 会 大 大 提升 。 
当 大 量 的 资源 都 是 数据 的 时 候 ， 现 在 的 搜索 引擎 已 经 不 能 满足 要 求 了 ， 这 
就 需要 对 搜索 引擎 进行 升级 。 

现在 的 百度 可 以 对 Excel、PDF 等 格式 文件 进行 搜索 ， 产 品名 称 叫 百 
度 文库 。 这 些 对 DOC 文件 、TXT 文件 、PDF 文件 、PPT 文件 或 XLS 文件 
的 搜索 ， 比 一 般 的 网 页 搜索 引擎 更 接近 于 数据 搜索 。 

数据 搜索 应 该 是 以 SQL 语言 为 标准 语言 的 一 种 搜索 ， 可 以 直接 输入 
SQL 语言 进行 查询 ， 也 可 以 输入 一 些 关键 词组 合成 SQL 语言 进行 查询 。 
查询 结果 输出 数据 ， 此 外 ， 还 要 包含 大 量 对 数据 的 解释 ， 而 不 仅仅 是 数据 
本 身 。 

虽然 雅虎 开创 的 分 类 检索 已 经 被 搜索 引擎 蔡 代 ， 但 数据 引擎 对 数据 库 
的 分 类 还 可 以 用 到 ， 它 可 以 作为 搜索 引擎 的 一 种 补充 。 因 为 对 数据 的 使 用 
方式 主要 是 读 取 ， 需 要 利用 类 似 照 相机 镜头 的 变焦 功能 完成 从 宏观 到 微观 ， 
或 微观 到 宏观 的 一 种 自由 切换 ， 跟 地 图 检索 的 方式 非常 接近 。 这 种 情况 下 ， 
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通过 分 类 ， 分 成 大 类 、 小 类 来 逐 级 寻找 数据 ， 应 该 比较 符合 大 家 对 数据 读 
取 的 习惯 。 

数据 搜索 引擎 比 现在 的 网 页 搜索 引擎 重要 性 要 高 。 搜 索引 擎 升级 以 后 ， 
应 该 和 现 有 搜索 引擎 兼容 。 


5. 3.2 基于 数据 的 云 服务 


云 计算 已 经 得 到 非常 大 的 发 展 ， 很 多 公司 都 推出 了 云 计算 的 平台 ， 云 
计算 的 概念 也 逐步 为 大 家 所 接受 。 

云 计 算 实 际 上 是 模仿 了 第 二 次 工业 革命 的 方法 ， 电 力 的 供应 是 集中 在 
发 电厂 ， 通 过 输电 线路 输 到 各 个 企业 和 家 庭 ， 用 户 只 要 花 很 少 的 钱 ， 就 可 
以 共享 这 么 庞大 的 发 电机 的 投资 成 果 。 

云 计算 通过 集中 大 量 的 服务 器 ， 将 服务 器 拥有 的 计算 能 力 通过 网 络 共 
享 ， 让 用 户 根据 需要 来 付费 。 从 数据 革命 的 未 来 来 衡量 ， 云 计算 目前 做 到 
这 一 步 还 是 初级 阶段 。 和 成 熟 的 电力 供应 相 比 ， 云 计算 服务 有 一 个 明显 的 
缺陷 。 我 们 知道 ， 电 力 线路 输送 的 电力 产品 是 一 个 标准 化 的 产品 ， 用 户 只 
要 通过 一 个 标准 插头 接 入 电力 线 网 络 就 可 以 获取 电力 。 而 在 云 计 算 环 境 
中 ， 通 过 互联 网 接 入 云 计算 平台 后 ， 所 获得 的 数据 千差万别 ， 无 法 直接 
使 用 。 

利用 现 有 的 云 计 算 功能 ， 每 个 人 只 能 读 自己 保存 在 云 计算 平台 上 的 数 
据 ， 难 以 看 到 或 看 懂 别 人 的 数据 。 虽 然 云 平台 也 保存 一 下 公用 格式 文件 ， 
可 以 通过 共享 看 到 ， 但 显然 跟 电力 供应 的 原理 有 很 大 的 不 同 。 发 电 企 业 所 
发 的 电 与 某 一 个 客户 的 规格 和 需求 无 关 ， 是 根据 自己 的 计划 来 发 电 ， 而 且 
同样 的 电力 可 以 在 不 同 的 用 户 之 间 进 行 任意 调配 。 

现在 带 数据 的 云 上 只 能 分 割 成 一 块 一 块 的 ， 为 每 一 个 用 户 定制 ， 类 似 一 
个 电厂 有 好 多 发 电机 ， 每 个 用 户 只 能 租 其 中 一 个 发 电机 ， 在 他 不 用 的 时 候 
发 电机 不 可 以 给 别人 用 。 

数据 时 代 的 云 计算 平台 主要 存储 一 些 公用 的 数据 ， 数 据 存储 格式 应 该 
是 标准 的 、 固 定 的 ， 其 他 人 可 以 方便 认识 和 共享 。 


现在 云 计算 供应 商 一 般 分 为 三 个 类 型 。 第 一 个 是 IaaS， 提 供 以 硬件 为 
基础 的 基础 设施 ， 第 二 个 是 PaaS， 提 供 一 个 公用 的 软件 开发 平台 ;第 三 个 
是 SaaS， 提 供 基于 软件 的 服务 。 

数据 时 代 会 出 现 Daas 供应 商 ， 提 供 数据 服务 。 随 着 DaaS 服务 内 容 的 
标准 化 、 服 务 对 象 越 来 越 多 ， 这 种 服务 应 该 成 为 云 计算 的 主流 。 慢 慢 地 ， 
其 他 云 计 算 的 服务 都 成 为 它 的 附属 设施 或 者 服务 保障 。 

为 什么 Daas 会 在 这 几 种 服务 中 脱颖而出 呢 ? 因为 Iaas 的 缺点 是 不 面 
向 最 终 客户 ， 因 此 它 的 市 场 容易 为 下 游 的 供应 商 所 控制 ，Saas 由 于 软件 的 
功能 比较 局 限 ,， 用户 面 比较 窗 ， 所 以 规模 不 会 很 大 ，PaaS 本 身 的 规模 不 大 ， 
处 于 中 间 层 次 ， 既 可 以 被 SaaS 的 厂商 替代 也 可 以 被 Iaas 的 厂商 所 替代 ， 
所 以 它 更 不 会 形成 一 种 独立 的 竞争 实力 。 但 是 ，DaaS 因为 提供 的 产品 比较 
标准 化 ， 服 务 面 比较 广 ， 所 以 它 会 成 为 以 后 云 计算 服务 商 的 主体 。 也 许 刚 
开始 ，DaaS 可 能 会 利用 IaaS 的 基础 设施 ， 并 且 从 SaaS 厂商 那里 获取 数据 
作为 起 步 ， 但 随 着 规模 的 扩大 ， 其 他 的 厂商 都 无 法 独立 生存 ， 最 后 被 DaaS 
的 厂商 合并 吸收 。 


5.3.3 可 以 检索 数据 的 浏览 器 


现在 的 浏览 器 已 成 为 很 多 人 进入 互联 网 的 入 口 ， 曾 有 过 代替 操作 系统 
的 趋势 。 

但 是 ， 相 对 于 全 球 的 数据 量 来 说 ， 通 过 浏览 器 看 到 的 只 是 很 小 的 一 部 
分 信息 ， 只 有 网 络 服务 器 上 以 HTML 语言 作为 标记 的 标准 文本 才能 被 浏览 
器 访问 到 。 一 般 的 网 页 都 比较 简单 ， 不 含有 大 量 的 数据 和 信息 。 也 就 是 说 ， 
虽然 我 们 可 以 通过 浏览 器 浏览 全 世界 范围 的 网 页 ， 但 这 些 网 页 所 含 的 信息 
量 在 世界 上 是 很 少 的 。 

同样 地 ， 如 果 我 们 用 Google 及 类 似 的 搜索 引擎 仅仅 搜索 网 页 ， 实 际 上 
也 仅 搜索 了 很 小 部 分 的 信息 。 更 多 的 信息 应 该 是 数据 。 为 了 支持 数据 的 搜 
索 浏 览 器 就 需要 改进 ， 目 前 的 HTML 版 本 是 5.0， 也 许 在 后 面 的 HTML 版 
本 中 会 加 入 对 数据 的 支持 。 数 据 最 好 采用 SQL 语言 访问 ， 但 可 以 加 一 些 标 
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虽然 很 多 数据 可 以 通过 编程 ， 以 网 页 的 方式 展示 ， 但 毕竟 这 些 数据 和 
网 页 还 是 捆绑 在 一 起 的 。 网 页 是 开发 一 个 程序 ， 由 前 台 和 后 台 构 成 。 未 来 
的 发 展 目标 是 数据 和 程序 分 离 ， 也 就 是 可 以 不 通过 网 页 程序 ， 而 是 通过 浏 
览 器 就 可 以 直接 访问 数据 。 
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引文 案例 

张 总 是 一 家 大 型 上 市 公司 总 经 理 。 

2030 年 秋季 的 一 个 普通 日 子 ， 睛 空 万 里 ， 张 总 怀 着 愉悦 的 心情 ， 脚 步 
轻快 地 来 到 办 公 室 。 

张 总 的 办 公 室 一 面 是 落地 玻璃 ， 可 以 看 到 这 个 城市 CBD 的 全 景 ， 一 
面 是 一 个 矩形 液晶 屏幕 ， 屏 幕 前 以 U 字形 围 着 一 圈 高 级 沙发 ， 沙 发 前 有 一 
个 可 以 移动 的 小 车 ， 小 车 上 有 一 个 触摸 屏 ， 大 概 有 40 英寸， 触摸屏 显示 
的 内 容 可 以 同时 显示 在 液晶 屏幕 上 。 张 总 的 办 公 虽 在 沙发 后 面 ， 桌面 上 也 
有 一 个 32 英寸 左右 的 4 区 显示 器 ， 但 不 像 普通 显示 器 横 放 ， 而 是 竖 放 着 。 

张 总 坐 到 办 公 桌 前 ， 打 开 电 脑 ， 进 入 公司 内 部 网 站 ,输入 自己 的 用 户 
名 和 密码 ， 首 先 呈 现在 眼前 的 是 一 个 综合 显示 经 营 数据 的 仪表 板 ， 上 面 展 
示 出 昨天 晚上 更 新 的 最 新 数据 ， 显示 到 昨天 下 班 为 止 公 司 主要 的 经 营 数据 ， 
仪表 板 上 用 多 个 像 汽车 速度 仪 一 样 的 小 仪表 盘 列 出 累计 销售 数量 、 累 计 销 
售 人 金额 、 累 计 毛 利 、 毛 利率 、 应 收 款 余额 、 累 计 采 购 订 单 金额 、 累 计 采 购 
入 库 数量 、 应 付款 余额 、 库 存 数 量 ， 除 余额 和 毛利 率 外 ， 这 些 数据 都 是 年 
初 至 今 的 合计 ， 也 就 是 从 今年 1 月 1 日 开始 到 昨天 的 累计 数据 ， 并 且 用 指 
针 显 示 和 去 年 同期 的 比较 。 

张 总 重点 关注 一 下 每 个 指标 的 指针 ， 这 个 指针 可 以 快速 看 到 和 去 年 同 
期 的 比较 情况 ， 如 果 指 针 偏 左 ， 表 明 数 据 低 于 去 年 ， 如 果 偏 右 ， 则 表明 数 
据 高 于 去 年 。 为 便于 对 经 营 状况 的 快速 识别 ， 仪 表盘 用 颜色 醒目 地 分 为 两 
个 区 ， 绿 区 和 红 区 。 如 果 指 针 在 绿 区 ， 表 明 数 据 指标 正常 ， 如 果 在 红 区 ， 
则 指标 异常 ,需要 引起 关注 。 根 据 指标 不 同 , 有 的 仪表 盘 绿 区 在 左 红 区 在 右 ， 
有 的 则 绿 区 在 右 红 区 在 左 。 比 如 ， 累 计 销 售 数量 、 累 计 销 售 金额 、 累 计 毛 
利 等 指标 是 越 大 越 好 ， 所 以 绿 区 在 右 ， 应 收 款 余额 、 应 付款 余额 和 库存 余 
额 等 指标 则 是 越 小 越 好 ， 所 以 绿 区 在 左边 。 


张 总 用 眼睛 反 了 一 下 所 有 仪表 盘 ， 发 现 大 部 分 都 在 绿 区 ， 只 有 应 收 款 
余额 在 中 间 偏 右 一 点 。“ 最 近 应 收 款 清 收 放松 一 下 ， 马 上 余额 就 增加 了 ， 
要 找 销售 部 算账 ”， 张 总 自 言 自 语 地 说 。 

张 总 没有 马上 叫 销 售 部 经 理 过 来 ,而 是 再 仔细 地 对 数据 进行 了 分 析 。 

他 在 仪表 板 上 看 了 一 下 应 收 款 余额 同比 增长 率 最 高 的 10 个 客户 名 单 
和 每 家 的 应 收 款 金 额 ， 发 现 排 名 第 一 的 增长 率 特别 高 ， 是 第 二 名 的 两 倍 。 

他 进入 应 收 款 分 析 主 题 ， 按 业务 维度 查询 应 收 款 余额 ， 发 现 销售 2 部 
合计 余额 最 大 , 再 看 同比 , 和 去 年 同期 相 比 , 也 是 销售 2 部 同比 增长 率 最 高 。 
到 底 是 销售 2 部 所 有 业务 员 的 应 收 款 余额 增加 ， 还 是 某 个 人 增加 呢 ? 他 用 
筷 标 点击 销售 2 部 ， 进 入 销售 2 部 所 有 业务 员 的 数据 比较 页 面 ， 发 现 一 个 
名 叫 李 明 的 业务 员 应 收 款 余额 同比 增长 率 最 高 。 再 点 击 李 明 ， 把 业务 员 维 
度 的 值 锁定 为 李 明 ， 接 着 进入 历史 维度 和 客户 维度 ， 发 现 两 个 重要 线索 : 

(1 ) 李 明 的 应 收 款 余额 是 这 个 月 刚 高 起 来 的 ， 原 来 是 正常 的 ; 

(2 ) 应 收 款 余额 增长 最 高 的 客户 就 是 李 明 的 客户 。 

于 是 ， 张 总 在 掌握 了 这 些 详细 信息 后 ， 给 销售 部 经 理 打 个 电话 ， 让 他 
和 销售 2 部 经 理 、 李 明 一 起 到 他 办 公 室 。 

几 个 人 到 达 办 公 室 后 ， 坐 在 液晶 屏 前 面 的 沙发 上 ， 销 售 部 经 理 熟 练 地 
打开 液晶 屏幕 和 移动 触摸 屏 ， 屏 幕 上 显示 出 和 张 总 桌 上 电脑 相同 的 页 面 。 
张 总 从 办 公 桌 前 走 过 来 ， 坐 在 中 间 的 沙发 上 ， 操 作 和 触摸 屏 把 刚才 自己 在 桌 
上 电脑 分 析 的 流程 走 一 遍 ， 要 求 销售 部 的 这 几 个 人 解释 一 下 应 收 款 余额 增 
加 的 原因 ， 并 要 求 整个 销售 部 根据 这 个 情况 作出 对 策 ， 防 止 其 他 客户 的 应 
收 款 余额 也 增加 。 

等 这 几 个 人 离开 办 公 室 ， 张 总 回 到 办 公 椅 子 上 ， 把 椅子 转向 落地 窗 ， 
心里 庆幸 有 这 个 先进 的 决策 支持 系统 。 如 果 是 传统 管理 模式 ， 首 先 自己 不 
会 发 现 这 种 情况 ， 只 有 在 财务 部 门 汇报 的 时 候 才 会 发 现 ， 然 后 马上 就 会 把 
销售 部 门 的 人 找 过 来 ， 要 求 销售 部 门 寻找 原因 进行 整改 ， 然 后 到 下 个 月 的 
财务 报告 出 来 的 时 候 ， 才 能 发 现 销售 部 门 的 整改 是 否 到 位 ， 是 继续 要 求 整 
改 还 是 把 这 个 问题 过 掉 。 也 就 是 说 ， 如 果 没有 一 个 详细 的 数据 分 析 ， 第 一 
个 他 不 可 能 自己 发 现 这 个 问题 ， 而 需要 财务 部 门 发 现 问题 后 来 汇报 ; 第 二 
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个 是 发 现 问题 之 后 自己 解决 不 了 ， 找 不 到 问题 所 在 ， 所 以 只 有 责令 下 属 去 
找 出 问题 ， 下 属 是 否 能 找 出 问题 他 也 无 从 知道 ; 第 三 个 是 反馈 的 时 间 非 常 
长 ， 必 须 等 下 个 月 的 数据 出 来 以 后 才能 发 现 。 有 的 时 候 找到 问题 的 根源 后 ， 
是 否 能 找到 解决 问题 的 方法 ， 最 后 能 否 得 到 认真 执行 ， 完 全 依赖 于 销售 部 
门 负责 人 的 能 力 和 信任 ， 而 他 自己 常常 是 无 能 为 力 。 这 个 在 一 些 管理 理论 
上 美 其 名 日 “结果 导向 ”， 也 就 是 说 只 要 应 收 款 余额 正常 了 就 好 ， 至 于 下 
属 是 怎么 采取 措施 的 就 不 管 了 。 传 统 的 管理 类 似 “黑箱 管理 ”， 是 在 缺乏 
数据 的 情况 下 的 无 奈 之 举 ， 但 被 一 些 理论 家 提 到 一 定 的 高 度 以 后 ,很 多 人 
把 它 当 作 一 个 法 宝 。 

张 总 现在 对 基于 决策 支持 系统 的 管理 新 方法 已 经 驾轻就熟 ， 在 有 了 详 
细 的 数据 以 后 ， 很 多 工作 不 必 依赖 下 属 ， 而 是 通过 数据 分 析 就 可 以 发 现 出 
现 这 种 情况 的 原因 ， 比 如 说 可 以 马上 进入 应 收 款 的 数据 分 析 这 个 主题 里 面 
去 ， 看 一 下 今年 应 收 款 余额 的 按时 间 整 体 走势 ， 还 可 以 看 一 下 同比 的 走势 ， 
然后 从 这 里 面 发 现 是 哪些 区 域 、 哪 些 客户 或 者 是 哪 一 个 销售 人 员 数 据 上 升 。 
一 般 情 况 下 ， 不 可 能 这 几 个 情况 同时 都 发 生 ， 更 多 的 可 能 是 某 个 区 域 上 升 
了 ， 一 般 的 一 个 区 域 是 由 几 个 销售 人 员 负 责 的 ， 我 们 就 会 发 现 可 能 是 这 几 
个 甚至 是 某 一 个 客户 应 收 款 的 账 期 超过 较 多 ， 甚 至 只 是 一 个 大 客户 。 在 锁 
定 这 个 大 客户 以 后 可 以 看 一 下 这 个 大 客户 的 应 收 款 的 历史 情况 ， 有 可 能 这 
个 大 客户 最 近 的 应 收 款 的 时 间 明 显 拉 长 ， 当 然 也 有 可 能 整个 区 域 的 客户 都 
产生 问题 。 这 种 情况 下 就 可 以 有 针对 性 地 叫 销售 部 门 的 主管 和 分 管 这 一 区 
域 的 组 长 甚至 是 营销 人 员 过 来 开会 ， 要求 他 们 对 这 种 现象 进行 分 析 ， 找 出 
原因 ， 也 许可 能 需要 由 销售 人 员 到 客户 现场 去 拜访 找 出 原因 ， 也 许 这 个 工 
厂 由 于 经 营 不 善 可 能 要 接近 破产 从 而 导致 了 应 收 款 的 账 期 拉 长 ， 这 种 情况 
下 要 把 该 客户 列 入 警示 名 单 ， 谨 慎 地 发 货 ， 缩 短 账 期 采取 一 定 的 措施 加 
紧 对 现 有 应 收 款 的 催收 ,减少 新 的 应 收 款 避 免 出 现 坏账 。 所 以 ， 通 过 数据 
分 析 可 以 发 现 工作 进行 中 隐藏 的 问题 ， 直 接 分 析出 问题 发 生 的 原因 ， 找 到 
解决 问题 的 方法 。 

上 午 其 他 时 间 无 事 ， 张 总 在 脑子 里 做 了 一 些 比 较 前 瞻 性 的 思考 ， 又 到 
研究 所 关注 一 下 新 产品 的 研发 进度 ， 到 几 个 部 门 找 几 个 高 薪 挖 过 来 的 人 聊 


聊天 ， 看 到 他 们 的 状态 都 不 错 。 

转眼 到 下 午 ， 是 月 度 例 行 会 议 的 时 间 ， 所 有 的 公司 高 层 都 集中 到 会 议 
室 里 进行 例 行 的 经 营 分 析 会 ， 对 公司 最 近 一 个 月 的 经 营 情况 进行 分 析 ， 看 
看 出 现 了 哪些 问题 。 

会 议 室 除 通常 的 会 议 桌 外 ， 一 面 墙 上 也 是 类 似 张 总 办 公 室 的 大 型 液晶 
屏幕 ， 但 屏幕 前 已 没有 移动 的 触摸 屏 ， 而 是 在 每 个 座位 前 都 放 了 一 个 平板 
电脑 ， 大 小 只 有 21 英寸 。 

会 议 按 惯例 由 各 个 部 门 汇报 情况 ， 流 程 是 先 口头 汇报 ， 再 用 PPT 显示 
相关 数据 的 统计 图 形 ， 这 些 图 形 都 是 从 决策 支持 系统 上 截图 下 来 的 ， 如 果 
有 问题 就 打开 决策 支持 系统 从 不 同 维度 对 数据 进行 研究 ， 找 出 问题 的 原因 。 

在 财务 部 汇报 时 ， 不 出 所 料 地 提出 应 收 款 余额 增加 的 问题 。 财 务 部 经 
理 按照 时 间 维 度 在 一 张 图 上 展示 销售 金额 、 收 款 金 额 、 应 收 款 余额 的 走势 
折线 图 ; 另 一 张 图 是 同样 指标 与 去 年 同期 相 比 的 同比 折线 图 。 在 图 上 发 现 ， 
从 上 个 月 开始 ， 应 收 款 余额 增加 了 ， 原 因 是 虽然 销售 额 增加 ， 但 收 款 金额 
下 降 ， 因 此 应 收 款 余额 上 升 的 幅度 高 于 销售 增加 的 幅度 ， 这 从 同比 的 折线 
图 上 看 起 来 更 一 目 了 然 。 

根据 财务 部 发 现 的 问题 ， 结 合 上 午 张 总 处 理 的 特例 ， 销 售 部 经 理 分 析 
了 出 现 这 种 情况 的 原因 ， 他 们 准备 采取 的 措施 和 预计 改善 的 时 间 。 

这 样 有 效率 的 公司 例会 ， 在 以 前 是 不 可 想象 的 。 张 总 清晰 地 记得 ， 以 
前 财务 部 门 在 发 现 有 问题 以 后 ， 肯 定 是 由 销售 部 门 笼 统 解释 一 下 这 样 的 原 
因 ， 并 且 提 出 一 些 整改 的 措施 。 如 果 销 售 部 经 理 原来 已 经 发 现 这 个 问题 或 
者 财务 部 门 私下 已 经 跟 他 交流 过 , 点 出 这 个 问题 , 他 可 能 就 会 找 出 问题 所 在 ， 
比如 说 ， 由 于 某 个 大 客户 应 收 款 清 收 的 问题 导致 这 样 的 情况 。 他 会 把 这 个 情 
况 汇报 一 下 ， 并 且 通 过 几 个 图 形 把 展示 出 他 们 是 如 何 找 出 这 个 问题 ， 来 证 明 
确实 是 导致 这 种 情况 的 原因 。 如 果 销 售 部 门 原来 没有 发 现 这 个 问题 ， 刚 刚 得 
知 的 话 ， 销 售 部 经 理 在 会 议 上 无 法 提出 具体 解决 方案 ， 只 能 回去 研究 这 个 问 
题 , 找 出 原因 并 且 在 下 次 会 议 上 提出 方法 或 者 直接 整改 以 后 把 结果 汇报 一 下 。 

例会 结束 后 ， 张 总 回 到 办 公 室 ， 泡 一 杯 咖啡 ， 坐 下 来 打开 邮箱 ， 看 看 
有 什么 邮件 需要 处 理 。 他 看 到 南方 子 公司 A 公司 审计 部 的 李 经 理 的 一 封 邮 
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件 ， 汇 报 一 下 最 近 的 审计 成 果 ， 主 要 是 告诉 张 总 ， 他 通过 比较 分 析 ， 发 现 
A 公司 的 库存 余额 同比 增长 率 比较 高 ， 并 把 自己 找到 的 问题 原因 和 解决 问 
题 的 建议 也 写 在 邮件 中 ， 邮 件 中 还 附 了 一 张 柱 形 图 ， 显 示 出 A 公司 库存 余 
额 同比 增长 率 的 时 间 走 势 情 况 ， 并 告诉 张 总 他 已 给 张 总 发 了 书签 ， 张 总 自 
己 可 以 找到 这 幅 图 并 做 深入 分 析 。 

张 总 在 决策 支持 系统 中 找到 李 经 理发 给 自己 的 书签 ， 在 库存 数据 分 析 
主题 中 打开 与 邮件 中 相同 的 统计 图 ,发 现 确实 存在 这 个 被 自己 忽略 的 问题 。 
他 通过 对 时 间 维 度 、 仓 库 维 度 、 存 货 维度 的 单独 与 综合 分 析 ， 验 证 一 下 李 
经 理 的 分 析 结 果 ， 基 本 同意 李 经 理 的 判断 和 建议 ， 但 在 和 生产 部 门 的 协调 
上 提出 一 个 补充 意见 。 随 后 ， 综 合 李 经 理 意 见 和 自己 意见 ， 写 了 一 个 邮件 
发 给 了 A 公司 总 经 理 ， 并 抄 送 李 经 理 。 

不 知 不 觉 ， 到 了 下 班 时 间 ， 张 总 关 掉 电脑 ， 拿 起 公文 包 ， 准 时 下 班 。 
准时 下 班 ， 对 张 总 是 常态 而 不 是 一 种 奢侈 ， 因 为 他 总 是 能 够 及 时 发 现 生产 
经 营 中 的 问题 迹象 ， 在 问题 变 得 严重 前 预先 处 理 了 ， 很 少 发 生 突如其来 的 
状况 。 虽 然 张 总 通过 智能 手机 也 可 以 使 用 决策 支持 系统 ， 但 他 很 少 在 下 班 
后 使 用 ， 大 部 分 是 在 出 差 时 使 用 。 


6.1 智能 制造 首先 要 解决 数据 问题 


信息 时 代 结 束 以 后 ， 有 一 种 说 法 ， 认 为 下 一 个 时 代 是 智能 制造 的 时 代 。 

智能 制造 是 一 种 制造 业 发 展 的 目标 ， 现 在 比较 流行 的 一 些 概念 和 技术 ， 
比如 工业 互联 网 、 工 业 4.0、 机 器 人 ， 都 是 为 智能 制造 服务 的 。 

那么 ， 智 能 制造 时 代 有 哪些 特点 呢 ? 既然 是 智能 ， 首 先是 智能 系统 ， 
可 以 说 是 一 个 人 体系 统 的 简化 版 ， 因 为 人 体 是 智能 系统 的 最 高 境界 。 

机 器 人 发 展 的 最 高 目标 是 模仿 人 ， 现 在 工业 上 很 多 机 器 人 是 一 些 机 器 
臂 或 者 说 只 是 模仿 人 局 部 的 一 个 功能 ， 并 不 能 模仿 一 个 整体 的 人 。 

人 的 神经 系统 由 中 枢 神 经 系统 和 周边 神经 系统 组 成 ， 中 枢 神 经 系统 由 


脑 和 兰 椎 组 成 ， 神 经 系统 由 数 以 亿 计 的 细胞 〈 神 经 元 ) 组 成 ， 脑 发 出 的 指 
令 通 过 神经 元 迅速 传递 到 身体 ， 将 身体 接收 的 信息 传递 给 大 脑 。 

一 个 人 完整 的 智能 控制 流程 是 怎样 的 呢 ? 简单 来 说 ， 人 体 的 智能 活动 
由 三 部 分 组 成 : 首先 是 通过 各 种 信息 的 输入 渠道 感知 外 部 的 信息 ， 包 括 视 
觉 感知 图 像 信息 、 耳 采 感 觉 声音 信息 和 其 他 的 味觉 、 嗅 觉 等 器 官 来 感知 其 
他 信息 ， 然 后 把 这 些 信息 传 到 大 脑 ， 大 脑 再 对 这 些 信 息 进 行 决策 ， 决 策 的 
结果 再 传递 到 人 体 的 四 肢 形成 动作 。 这 就 是 人 体 智能 的 基本 流程 。 

显然 ， 这 个 流程 是 一 个 循环 ， 而 且 是 一 种 闭环 结构 ， 一 个 不 断 地 循环 
往复 的 过 程 ， 人 体系 统 根据 动作 产生 新 的 信息 ， 并 得 到 反馈 ， 来 不 断 对 动 
作 进 行 调整 ， 其 中 的 核心 是 神经 系统 。 神 经 系统 有 上 传 信号 和 下 传 信号 两 
种 ， 上 传 信号 就 是 把 收集 到 的 信息 上 传 到 大 脑 ， 下 传 信号 就 是 把 大 脑 的 决 
策 传 递 到 四 肢 进行 动作 。 

神经 系统 在 人 体 的 智能 系统 起 到 非常 重要 的 作用 ， 进 一 步 分 解 来 说 ， 
人 体 的 活动 需要 有 信息 的 获取 、 决 策 的 制定 和 动作 的 进行 这 三 个 部 分 。 

仔细 分 析 一 下 能 够 发 现 ， 如 果 不 考虑 人 工 智能 的 决策 ， 也 不 考虑 执行 ， 
仅仅 只 考虑 信息 的 采集 ， 能 不 能 把 各 个 制造 系统 各 部 件 的 信号 采集 输送 到 
控制 中 心 ， 让 中 心 的 中 央 决 策 系统 能 够 看 懂 这 些 信号 的 含义 ， 这 个 问题 现 
在 并 没有 解决 ， 这 也 是 数据 革命 的 核心 内 容 。 

如 果 说 大 家 认可 数据 革命 ， 认 为 数据 革命 是 一 项 必须 的 工作 ， 而 且 认 
为 数据 革命 是 非常 复杂 的 ， 需 要 人 们 花 很 多 时 间 去 实现 这 样 一 项 工作 的 话 ， 
那么 大 家 会 想到 智能 制造 还 很 遥远 。 

目前 , 首先 要 进行 的 还 是 数据 革命 , 即 先 解决 数据 的 采集 、 传输 和 识别 ， 
至 于 根据 这 个 识别 如 何 做 出 相应 的 动作 ， 现 在 人 工 智能 研究 发 展 很 快 ， 在 
深度 学 习 方 面 的 突破 可 能 能 够 解决 这 个 问题 。 

不 难看 出 ， 现 在 数据 的 处 理 实际 上 变 成 智能 制造 的 前 置 条 件 。 

再 从 智能 制造 的 设备 的 布局 来 说 ， 只 有 把 数据 传送 上 去 ， 命 令 的 指令 
才能 传送 下 来 。 首 先 ， 现 在 大 量 的 设备 是 不 是 智能 的 ， 能 不 能 够 采集 数据 
还 是 个 大 问题 。 从 某 方面 来 说 ， 有 很 多 设备 还 是 需要 更 新 换代 的 。 其 次 ， 
有 了 数据 之 后 ， 是 不 是 能 够 传输 到 数据 库 中 。 
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因为 现在 有 很 多 的 智能 设备 的 控制 模块 和 设备 是 分 开 来 卖 的 ， 如 果 你 
要 增加 控制 模块 需要 增加 费用 。 有 的 企业 为 了 节约 成 本 ， 并 没有 购买 设备 
的 控制 模块 ， 虽 然 设备 上 有 数据 的 采集 和 传输 功能 ， 但 无 法 使 用 。 

再 次 是 网 络 问题 。 在 企业 、 车 间 中 需要 网 络 , 因为 数据 量 很 大 、 点 又 多 ， 
比 一 般 的 办 公 室 规模 要 大 得 多 ， 所 以 网 络 要 成 熟 。 

还 有 就 是 涉及 一 个 大 数据 的 存储 和 处 理 。 一 般 的 工厂 能 不 能 存储 这 么 
大 的 数据 ， 如 果 数 据 只 是 监控 用 ， 只 能 存 半年 然后 就 丢掉 ， 显 然 不 能 满足 
这 个 要 求 。 

这 么 多 数据 的 识别 ， 相 当 于 监控 ， 只 看 一 个 时 间 点 的 数据 ， 可 以 选择 
看 一 台 设 备 。 假 如 现在 有 很 多 设备 有 很 多 时 间 点 的 数据 ， 这 显然 对 技术 是 
一 个 很 大 的 考验 ， 这 是 数据 时 代 应 该 解决 的 问题 。 

只 有 数据 能 够 存储 、 识 别 ， 那 样 才能 有 决策 ， 才 能 智能 化 。 所 以 下 一 
个 时 代 应 该 是 数据 时 代 ， 智 能 制造 时 代 应 该 是 再 下 一 个 时 代 的 事情 。 

为 什么 会 提出 包括 机 器 人 的 智能 时 代 呢 ， 实 际 上 是 人 类 在 发 展 中 比较 
普遍 的 现象 ， 就 是 在 目标 没有 明确 的 情况 下 ， 通 常会 把 抽象 的 技术 拿 出 来 
作为 目标 ， 实 际 上 是 权宜 之 计 。 在 向 这 个 目标 前 进 的 过 程 中 ， 发 现 了 一 种 
比较 适宜 的 技术 以 后 ， 革 命 的 方向 就 会 改变 ， 变 成 比较 实际 的 技术 ， 即 人 
类 是 可 以 实现 的 并 马上 产生 效果 的 技术 ， 这 样 才 会 吸引 大 量 的 资金 、 人 力 、 
物力 的 投入 ， 形 成 产业 的 一 个 高 潮 。 

所 以 ， 如 果 把 智能 制造 当成 前 面 十 公里 的 目标 ， 可 能 在 三 公里 的 时 候 
发 现 了 数据 时 代 的 目标 ， 会 转变 方向 ， 大 部 分 人 最 终 进入 的 是 数据 时 代 ， 
但 我 们 的 眼光 依然 看 着 十 公里 以 外 的 智能 制造 时 代 。 数 据 时 代 是 走向 智能 
制造 时 代 的 一 个 里 程 碑 ， 最 终 还 是 要 奔 向 智能 时 代 。 

作为 企业 ， 资 金 是 有 限 的 ， 经 营 的 周期 也 是 有 限 的 ， 每 天 也 都 会 有 固 
定 的 成 本 ， 所 以 对 方向 的 选择 很 重要 。 如 果 在 遥远 的 未 来 ， 他 的 资金 只 能 
维持 在 四 公里 ， 就 只 能 对 数据 技术 进行 投资 ， 根 本 没有 能 力 支 撑 他 跑 到 十 
公里 外 的 智能 制造 时 代 。 


6.2 工业 企业 数据 总 体 架构 


一 个 制造 企业 有 哪些 数据 ， 数 据 从 哪里 来 ， 互 相 之 间 有 什么 关系 ， 是 
一 个 企业 信息 化 规划 的 重点 。 有 了 规划 ， 就 知道 应 该 上 什么 信息 系统 ， 与 
现 有 系统 相 比 ， 还 有 哪些 缺口 。 

制造 企业 的 数据 来 源 有 六 层 〈 见 图 6-1) ， 分 别 是 : L0 层 现场 仪表 ， 
L1 层 智能 仪表 ; L2 层 控制 数据 ; L3 层 生产 数据 ，L4 层 经 营 数据 ; L5 层 
财务 数据 。 





L5: 财务 数据 。 | 数据 来 源 : 








再 财务 软件 
L4: 经 营 数据 ERP、CRM、HR. 
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L3: 生产 数据 MES 








L2: 控制 数据 PLC、 DCS、 FCS 
在 

L1: (智能 仪表 ) 

L0: 现场 仪表 ) | 会 数据 传递 方向 























图 6-1 企业 数据 的 总 体 架构 


考虑 到 数据 的 归 集 ， 通 过 网 络 最 低层 只 能 读 到 工 2 层 控制 数据 ， 所 以 ， 
数据 处 理 只 有 四 层 。 

图 6-2 显示 各 层次 数据 维度 和 数据 粒度 。 控 制 层 数据 来 源 于 PLC、 
DCS 或 FCS 系统 ， 主 要 维度 有 客户 、 采 集 点 、 工 艺 参数 ， 时 间 维 度 包括 时 、 
分 、 秒 、 亚 秒 ， 被 企业 车 间 层 关注 ， 主 要 关注 数据 采集 点 的 平均 值 、 最 大 
值 或 最 小 值 。 

生产 层 数据 来 源 于 MES 系统 ， 主 要 维度 有 设备 、 物 料 、 班 次 等 ， 时 间 
维度 包括 日 、 轮班 、 时 、 分 、 秒 , 被 企业 车 间 层 和 部 门 层 关注 ,主要 关注 产量 。 

业务 层 数据 来 源 于 ERP、CRM、DRP 等 系统 , 主要 维度 有 客户 、 存 货 等 ， 
时 间 维 度 包括 月 、 周 、 日 ， 被 企业 部 门 层 和 公司 层 关注 ， 主 要 关注 数量 和 
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金额 。 

财务 层 数据 来 源 于 财务 软件 系统 ， 主 要 维度 有 客户 ， 时 间 维 度 包括 年 、 
季 、 月 ， 被 企业 公司 层 和 财务 部 门 关注 ， 主 要 关注 金额 。 

四 层 之 间 的 数据 关系 是 : 财务 数据 来 源 于 经 营 数据 ， 经 营 数据 来 源 于 
生产 数据 ， 生 产 数据 来 源 于 控制 数据 。 但 每 层 的 数据 又 不 仅仅 来 源 于 下 层 ， 
比如 财务 数据 还 来 源 于 费用 报销 和 银行 ， 经 营 数据 还 来 源 于 采购 和 仓库 。 


一 -一 
财务 数据 年 、 季 、 月 
(财务 软件 ) [ ss] Z 客 户 的 应 收 款 100 万 元 
~ A 


业务 月 、 周 、 日 A 订单 产品 M1 100 吨 50 万 元 
ee 写 控制 A 订单 产品 M2 50 吨 30 万 元 


SR 
L5 
Nasa 
二 
L4 
J DRP) 客户 存货 \B 订 单产 品 M3 10 吨 20 万 元 
= 
L3 
Ne 
一 人 
L2 








设备 || 物料 || 班次 【产品 M2 设 备 E2? 累 计生 产 12 邑 


RE 
控制 数据 A 参数 A 平均 值 、 最 大 值 、 最 小 值 


a 
TT 
生产 数据 日 、 轮 班 、 时 、 分 、 秒 || A 订单 
生产 协调 控制 产品 M1 设备 El 累计 生产 8 吨 
(MES) 














人 DCS |( 客户 ] 人 位置 参数 B 平 均值 、 最 大 值 、 最 小 什 
\ 寺 / | 工艺 参数 J 

















6-2 各 层次 数据 维度 和 数据 粒度 


图 6-3 显示 各 层次 数据 的 使 用 对 象 ， 公 司 层 〈 决 策 层 ) 关注 财务 和 业 
务 数据 ， 部 门 层 〈 管 理 层 ) 关注 业务 和 生产 数据 ， 车 间 层 〈 执 行 层 ) 关注 
生产 和 控制 数据 。 


公司 层 ” 部门 层 。 车 间 层 





L2 控制 数据 
图 6-3 各 层次 数据 的 使 用 对 象 


6.3 ”财务 数据 分 析 


6.3.1 四 个 层次 


财务 数据 来 源 于 财务 关系 软件 ， 可 以 从 凭证 中 抽取 数据 进行 分 析 。 
财务 数据 分 析 可 以 分 为 四 个 层次 (图 6-4) : 财务 凭证 层 、 财 务 指标 层 、 
财务 比率 层 和 综合 指标 层 。 
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图 6-4 财务 数据 分 析 总 体 架构 

















财务 凭证 层 直 接 读 取 财 务 凭证 数据 ， 可 以 按 不 同 核算 账 笑 、 会 计 主 体 、 
科目 和 辅助 核算 查询 到 数据 的 合计 及 明细 。 

财务 指标 层 则 按 资产 负债 表 、 利 润 表 、 现 金 流量 表 上 的 财务 指标 ， 根 
据 组 成 指标 的 科目 ， 用 财务 凭证 的 数据 进行 计算 。 比 如 ， 资 产 负债 表 中 的 
流动 资产 由 货币 资金 、 应 收 票 据 、 应 收 账 款 、 预 付 账 款 、 应 收 股利 、 应 收 
利息 、 存 货 、 其 他 应 收 款 等 多 个 指标 构成 ， 而 货币 资金 可 以 通过 科目 1001 
库存 现金 、1002 银行 存款 、1012 其 他 货币 资金 用 凭证 中 数据 汇总 而 成 。 

财务 比率 则 由 财务 指标 计算 而 来 。 财 务 比率 有 销售 利润 率 、 营 业 利 润 
率 、 营业 成 本 率 、 期间 费 用 率 、 成 本 费用 利润 率 、 销售 费用 率 、 管理 费用 率 、 
财务 费用 率 、 经 营 现 金 净 额 、 销 售 收 到 现金 、 销 售 现金 比率 、 营 业 收 入 现 
金 售 量 、 存 货 周转 率 (次 ) 、 应 收 账 款 周转 率 、 应 收 账 款 周转 天 数 (天 /次 ) 、 
营业 周期 (天 /次 ) 、 存 货 周转 天 数 〈 天 /次 ) 等 多 种 。 

比如 ， 存 货 周转 率 用 于 计算 企业 在 一 定时 期 内 占用 资金 可 周转 的 次 数 。 
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存货 周转 率 是 企业 一 定时 期 销 货 成 本 与 平均 存货 余额 的 比率 。 用 于 反映 存 
货 的 周转 速度 ， 即 存货 的 流动 性 及 存货 资金 占用 量 是 否 合理 ， 促 使 企业 在 
保证 生产 经 营 连续 性 的 同时 ， 提 高 资金 的 使 用 效率 ， 增 强 企业 的 短期 偿 债 
能 力 。 

存货 周转 率 计算 公式 为 销售 成 本 /平均 存货 ， 销 售 成 本 直接 取 财 务 指 
标 ， 平 均 存货 需要 把 期 初 存货 加 期 末 存 货 除 以 2。 

综合 指标 是 用 一 个 数据 评价 企业 的 业绩 好 坏 。 综 合 指标 主要 有 沃 尔 综 
合 评分 法 和 阿 特 曼 Z-score 模型 。 


6.3.2 阿 特 曼 Z-score 横 型 


Z-score 模型 以 多 变量 的 统计 方法 为 基础 ， 以 破产 企业 为 样本 ， 通 过 大 
量 的 实验 ， 对 企业 的 运行 状况 、 破 产 与 否 进行 分 析 、 判 别 的 系统 。 

Z 值 用 5 个 值 加 系数 计算 而 来 ，Z 值 越 小 ， 企 业 失 败 的 可 能 性 越 大 。 

计算 Z 值 的 每 个 值 来 源 于 财务 指标 ， 对 于 公开 上 市 公司 ， 使 用 模型 A: 

了 X= 流动 资本 / 总 资产 = (流动 资产 - 流动 负债 ) / 总 资产 

22= 留 存 收 益 / 总 资产 = (股东 权益 合计 - 股本 ) /总 资产 

X33= 息 税 前 收益 /总 资产 =〈 利 润 总 额 + 财务 费用 ) /总 资产 

X4= 优先 股 和 普通 股市 值 / 总 负债 = 股票 市 值 X 股票 总 数 ) / 总 负债 

X5= 销售 额 / 总 资产 

如 果 企 业 的 Z 值 大 于 2.99， 企 业经 营 处 于 安全 区 。 如 果 Z 值 小 于 1.8， 
则 企业 很 有 可 能 破产 。 在 1.8 和 2.99 之 间 ， 则 属于 灰色 区 。 

对 于 非 上 市 公司 ， 使 用 模型 B，X4 的 计算 公式 不 同 : 

X4= 权益 账面 价值 / 总 负债 

制造 业 的 计算 公式 为 : 2=0.717X1+0.847X2+3.107X3+0.420X4+0.998X5 

如 果 企 业 的 Z 值 大 于 2.9， 企 业经 营 处 于 安全 区 。 如 果 Z 值 小 于 1.23， 
则 企业 很 有 可 能 破产 。 在 1.23 ~ 2.9， 则 属于 灰色 区 。 

非 制造 业 的 计算 公式 为 :2Z=6.56X1+3.26X2+6.72X3+1.05X4 

新 兴 市 场 的 计算 公司 为 : Z=3.25 + 6.56X1+3.26X2+6.72X3+1.05X4 


对 于 非 制造 业 和 新 兴 市 场 ， 如 果 企业 的 Z 值 大 于 2.6， 企 业经 营 处 于 
安全 区 。 如 果 Z 值 小 于 1.1， 则 企业 很 有 可 能 破产 。 在 1.1 和 2.6 之 间 ， 则 
属于 灰色 区 。 


6.3.3 财务 比率 


财务 比率 是 以 财务 报表 资料 为 依据 ， 将 两 个 相关 的 数据 进行 相 除 而 得 
到 的 比率 。 张 燕 、 张 樟 德 编著 的 《最 实用 的 120 种 财务 分 析 工 具 》 四 描述 
了 能 收集 到 的 所 有 财务 比率 ， 但 具体 使 用 时 还 需要 调整 ， 保 证 每 个 参数 都 
可 以 从 财务 报表 中 读 取 。 

财务 比率 按 短 期 偿 债 能 力 、 长 期 偿 债 能 力 、 营 运 能 力 、 获 利 能 力 、 发 
展 能 力 分 为 五 类 。 

短期 偿 债 能 力 中 的 财务 比率 有 流动 比率 、 现 金 比 率 、 现 金 流量 比率 、 
现金 净 流 量 比率 、 现 金 流动 负债 比率 、 应 付 账 款 平均 付 账 期 、 营 运 资本 对 
总 资产 的 比率 、 营 运 资金 、 营 运 比率 、 现 金 流动 比率 、 经 营 活动 的 现金 流 
量 本 期 到 期 债务 率 、 债 务 现金 支付 率 、 现 金 流量 对 资本 支出 的 比率 、 外 部 
融资 比率 。 

长 期 偿 债 能 力 中 的 财务 比率 有 资产 负债 率 、 产 权 比 率 、 公 积 金 与 权益 
资本 比率 、 有 形 净值 负债 率 、 股 东 权 益 比 率 、 权 益 乘 数 、 长 期 资产 适合 率 、 
长 期 负债 与 固定 资产 比率 、 长 期 负债 与 营运 资金 的 比率 、 债 务 保障 比率 、 
长 期 负债 比率 、 现 金 负债 总 额 比 。 

营运 能 力 中 的 财务 比率 有 存货 周转 率 、 存 货 周转 天 数 、 应 收 账 款 周转 
率 、 应 收 账 款 周转 天 数 、 营 业 周 期 、 营 运 资本 周转 率 、 流 动 资产 周转 率 、 
流动 资产 周转 天 数 、 流 动 资产 利润 率 、 固 定 资产 收入 率 、 固 定 资产 利润 率 、 
固定 资产 增长 率 、 资 产 周 转 率 、 总 资产 利润 率 、 加 速 流动 资产 周转 所 增加 
的 收入 。 

获 利 能 力 中 的 财务 比率 有 资产 净利 率 、 流 动 资产 利润 率 、 流 动 资产 营 
业 净 利率 、 资 产 现金 回报 率 、 所 有 者 权益 现金 回报 率 、 主 营业 务 收 现 率 、 
销售 现金 比率 、 营 业 活动 收益 质量 比率 、 盘 利 质量 比率 、 鼻 余 现金 保障 倍数 、 
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营运 指数 、 全 部 资产 现金 回收 率 、 经 营 现金 比率 、 净 资产 收益 率 、 资 本 金 
利润 率 、 资 本 保值 增值 率 、 营 业 毛 利率 、 销 售 利润 率 、 销 售 净利 率 、 现 金 
流量 净利 率 、 销 货 收 现 率 、 成 本 费用 利润 率 、 全 部 成 本 费用 总 ( 净 ) 利润 率 、 
主 营 业务 利润 率 、 营 业 利润 率 。 

发 展 能 力 中 的 财务 比率 有 资产 增长 率 、 资 本 积累 率 、 销 售 增长 率 、 三 
年 销售 平均 增长 率 、 利 润 增长 率 、 主 营业 务 鲜 明 率 。 


6.4 经 营 数据 分 析 


经 营 数据 也 是 供应 链 数据 ， 包 括 企业 的 销售 、 采 购 、 应 收 、 应 付 和 库 
存 的 数据 。 经 营 数据 的 来 源 是 企业 的 ERP 系统 。 

经 营 数据 分 析 可 以 分 为 经 营 数据 中 心 、 销 售 数据 分 析 、 毛 利 数据 分 析 、 
采购 数据 分 析 、 应 收 款 数据 分 析 、 应 付款 数据 分 析 、 库存 数据 分 析 七 个 主题 。 

图 6-5 是 程序 实现 的 界面 ， 左 边 菜单 列 出 不 同 的 主题 ， 右 边 最 上 面 的 
标签 区 分 主题 ， 下 面 横 条 中 的 标签 控制 同 个 主题 的 不 同 维 度 ， 每 个 统计 图 


a 








> 


图 6-5 决策 支持 系统 的 程序 页 面 


形 对 应 一 个 或 多 个 指标 ， 统 计 图 形 的 横 轴 与 维度 相关 。 在 统计 图 形 上 ， 折 
线 图 的 圆 点 或 直方 图 的 柱子 可 以 用 鼠标 单 击 ， 显 示 下 级 的 数据 ， 比 如 某 一 
年 或 某 个 省 。 

表 6-1 显示 经 营 数据 分 析 中 各 个 主题 的 维度 ， 可 以 看 出 ， 许 多 主题 的 
维度 是 相同 的 。 


表 6-1 ”主题 与 维度 对 照 表 


主题 \ 维 度 。 | 日 期 | 内 各 | 开交 | 部 门 | 业务 员 | 存货 | 仓库 | | 和 
经 营 数据 中 心 | v J 





| 应 付款 数据 分 析 | v | v | Y | 
| 库存 数据 分析 | v | | | | 








| 
| 
| 
| 


6.4.1 名 词 解释 


(1) 业务 类 型 ， 按 各 行业 中 需要 处 理事 务 的 不 同 所 进行 的 种 类 划分 。 
不 同业 务 类 型 其 业务 的 处 理 过 程 及 财务 收 支 核算 的 过 程 有 差异 ， 所 以 对 应 
在 系统 中 也 会 有 不 同 的 业务 处 理 流程 。 一 般 有 销售 业务 类 型 和 采购 业务 类 
型 ， 供 应 链 管 理 中 系统 默认 分 为 : 经 销 、 代 销 、 直 运销 售 、 直 运 采 购 、 普 
通 采购 、 委 托 代 销 ， 等 等 。 也 可 以 根据 企业 自身 情况 进行 自 定义 。 

(2) 信用 额度 : 即 允 许 客户 累计 欠 款 的 最 高 额度 。 这 是 控制 企业 财务 
风险 的 一 个 必须 要 素 ， 对 不 同等 级 的 客户 有 不 同 的 信用 额度 授权 。 如 果 超 
出 该 客户 的 信用 额度 ，ERP 马上 给 予 预警 提示 ， 并 自动 阻止 该 客户 新 订单 
或 新 发 货 ， 通 知 相关 部 门 催 款 ， 大 大 降低 企业 应 收 款 风险 。 

(3) 信用 账 期 : 账 期 是 指向 客户 供 货 后 ， 允 许 客户 从 款 的 最 长 时 间 。 
企业 在 规定 时 间 内 给 予 客 户 一 定金 额 的 信用 额度 ， 在 规定 时 间 内 必须 回 款 ， 
这 个 规定 时 间 内 的 周期 就 称 为 账 期 ， 额 度 和 账 期 一 般 可 以 根据 合作 的 情况 
进行 调整 。 
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(4) 账 龄 分 析 : 账 龄 指 公司 尚未 收回 的 应 收 账 款 的 时 间 长 度 ， 对 仍 
在 重复 销售 的 客户 而 言 同时 也 是 应 收 账 款 的 周转 天 数 。 通 常 按照 各 自 企 业 
合理 的 周转 天 数 将 其 划分 为 四 个 级 别 ， 如 将 合理 的 周转 天 数 设 定 为 30 天 ， 
即 可 分 为 30 天 以 内 、30 ~ 60 天 、60 ~ 120 天 及 120 天 以 上 。 

(5) 库存 账 龄 : 库存 账 龄 在 ERP 系统 内 , 应 该 可 以 查询 指定 的 时 间 点 ， 
各 库存 存货 的 库存 账 龄 情况 ， 即 从 入 库 起 在 仓库 中 放置 了 多 久 。 与 应 收 账 
款 的 账 龄 一 样 , 存货 的 库存 账 龄 越 长 , 说 明 周 转 越 慢 , 占 压 的 资金 也 就 越 多 。 
库存 账 龄 = 工 ( 批 次 入 库 数 量 x 批 次 入 库 时 间 / 统计 时 点 库存 总 额 )。 

(6) 合并 客户 : 一 个 集团 或 公司 下 有 多 个 子 公司 ， 多 个 子 公司 分 别 
作为 单个 客户 跟 企业 有 销售 业务 ， 但 在 销售 数据 分 析 中 显示 销售 客户 的 排 
名 时 ， 子 公司 的 排名 就 比较 落后 。 但 整个 集团 或 总 公司 中 的 业务 排名 是 比 
较 靠 前 的 ， 这 时 ， 我 们 可 以 通过 设置 把 多 个 子 公司 合并 到 集团 或 总 公司 中 ， 
把 单个 客户 汇总 显示 集团 或 总 公司 的 排名 。 


6.4.2 经 营 数据 中 心 


经 营 数据 中 心 汇 集 主 要 的 经 营 数据 ， 用 于 监控 企业 的 日 常 经 营 状 况 。 
每 天 显示 前 一 天 的 年 初 至 今 合 计数 据 ， 并 显示 当年 的 数据 按 月 分 布 情况 ， 
按 下 属 企业 或 部 门 的 分 布 情况 。 

经 营 数据 中 心 以 仪表 板 形式 ， 主 要 以 企业 决策 层 为 使 用 对 象 。 但 如 果 
想 仔 细 分 析 某 个 指标 ， 可 以 进入 具体 的 主题 进行 OLAP 分 析 ， 通 过 钻 取 可 
以 看 到 具体 的 明细 记录 。 比 如 看 到 销售 收入 年 初 至 今 数据 不 太 满意 ， 可 以 
转 到 销售 数据 分 析 主 题 ， 按 客户 分 析 看 到 每 个 客户 的 销售 数据 ， 直 至 客户 
的 每 个 具体 订单 或 发 货 单 。 

图 6-6 显示 最 近 时 间 主 要 指标 的 仪表 板 ， 图 6-7 显示 按 主 要 维度 〈 时 
间 和 组 织 ) 指标 ， 图 6-8 显示 按 一 个 指标 的 排名 和 份额 。 

查询 维度 分 为 日 期 维度 和 组 织 维度 。 

(1) 日 期 维度 : 层次 结构 的 级 别 为 年 、 月 、 日 ， 开 始 时 间 为 年 初 ， 
即 1 月 1 号 ， 如 果 日 期 包括 当年 当月 ， 为 至 当前 日 的 前 一 天 为 止 的 累计 值 ， 


否则 等 同年 度 或 月 度数 据 值 。 
(2) 组 织 维度 : 可 具体 分 级 为 集团 、 子 公司 、 部 门 。 
在 经 营 数据 中 心 ， 显 示 以 下 指标 : 
(1) 累计 毛利 : 期 初 至 今 毛利 的 累计 值 。 
(2) 毛利 率 : 累计 毛利 / 累计 销售 收入 X 100%。 
(3) 累计 销售 数量 : 期 初 至 今 销售 出 库 数 量 的 累计 值 。 
(4) 累计 销售 金额 : 期 初 至 今 销售 出 库 金 额 的 累计 值 。 
(5) 应 收 坎 余额: 期 末 核 销 的 累计 应 收 款 金额 。 
(6) 累计 采购 订单 金额 : 期 初 至 今 采购 金额 的 累计 。 
(7) 累计 采购 入 库 数量 :期 初 至 今 采购 入 库 数量 的 累计 。 
(8) 应 付款 余额 : 期 末 核 销 的 累计 应 付款 金额 。 
(9) 库存 数量 : 根据 存货 分 类 显示 本 期 最 后 一 天 的 库存 数量 。 














图 6-6 显示 最 近 时 间 主 要 指标 的 仪表 板 


(10) 历史 销售 金额 : 销售 金额 的 时 间 走 势 。 

(11) 组 织 销售 金额 : 各 个 组 织 销售 金额 的 比较 。 

(12) 客户 销售 金额 排名 TOP10: 销售 出 库 金额 最 高 的 前 十 名 客户 。 

(13) 客户 销售 金额 排名 TOP10 份额 : 销售 出 库 金额 最 高 的 前 十 名 客 
户 的 占 比 情况 。 

(14) 业务 人 员 销 售 金额 排名 TOP10: 销售 出 库 金额 最 高 的 前 十 名 业 
务 员 。 


|183 





铸 灯 小 坟 疼 二 当当 应 从 广泛 省 
\ 古 几 哺 泛 - 


全; 


184| 


箱 历史 销售 金额 (万 元 ) 明 宫 
20 000 





10 000 


0 
] 月 2 月 3 月 4 月 5 月 人 月 7 月 8 月 9 月 10 月 1 月 12 月 
图 销售 金额 国 出 库 金 额 看 已 收 款 


们 组 织 销售 金额 (万 元 ) 
60 000 
48 000 
36 000 
24 000 
12 000 


























0 一 一 am 
营销 中 心 。 外 贸 部 。 ”生产 中 心 ”礼品 团购 部 ”事业 部 服务 部 
山 销 售 金额 证 出 库 数量 














图 6-7 显示 按 主 要 维度 (时 间 和 组 织 ) 指标 


(15) 业务 人 员 销 售 金额 TOP10 份额 : 销售 出 库 金额 最 高 的 前 十 名 业 
务 员 的 占 比 情况 。 

(16) 存货 销售 金额 排名 TOP10: 销售 出 库 金额 最 高 的 前 十 个 存货 。 

(17) 存货 销售 金额 排名 TOP10 份额 : 销售 出 库 金额 最 高 的 前 十 个 存 
货 的 占 比 情况 。 

(18) 销售 金额 增长 率 最 高 的 10 个 客户 : 销售 出 库 金 额 同 比 增长 最 
快 的 前 十 名 客户 (去 年 销售 出 库 金 额 取 排名 前 70% 的 客户 做 比较 ) 。 

(19) 销售 金额 下 降 率 最 高 的 10 个 客户 : 销售 出 库 金 额 同 比 增长 最 
慢 (包括 下 降 ) 的 10 名 客户 (去 年 销售 出 库 金 额 取 排名 前 70% 的 客户 做 比较 )。 

(20) 销售 金额 增长 率 最 高 的 10 个 业务 员 : 销售 出 库 金 额 同比 增长 
最 快 的 前 10 个 业务 员 (去 年 销售 出 库 金 额 取 排名 前 70% 的 业务 员 做 比较 ) 。 

(21) 销售 金额 下 降 率 最 高 的 10 个 业务 员 : 销售 出 库 金 额 同比 增长 
最 慢 (包括 下 降 ) 的 10 个 业务 员 〈 去 年 销售 出 库 金 额 取 排名 前 70% 的 业 


务 员 做 比较 ) 。 

(22) 销售 金额 增长 率 最 高 的 10 种 存货 : 销售 出 库 金额 同比 增长 最 
快 的 前 十 种 存货 〈 去 年 销售 出 库 金 额 取 排名 前 70% 的 存货 做 比较 ) 。 

(23 ) 销 售 金额 下 降 率 最 高 的 10 种 存货 : 销售 出 库 金 额 同比 增长 最 慢 ( 包 
括 下 降 ) 的 10 名 存货 〈 去 年 销售 出 库 金 额 取 排名 前 70% 的 存货 做 比较 ) 。 

(24) 应 收 款 排名 TOP10 客户 : 应 收 款 最 多 的 前 10 名 客户 。 

(25) 应 收 款 排名 TOP10 客户 份额 :应 收 款 最 多 的 前 10 个 客户 的 占 
比 情 况 。 

(26) 应 收 款 增长 率 最 高 的 10 个 客户 : 应 收 款 同比 增长 最 快 的 前 10 
个 客户 去 年 应 收 款 排名 前 70% 的 客户 做 比较 ) 。 


条 应 收 款 排 名 TOP10 害 户 轨 站 














0 2 400 4800 7 200 9600 12000 
入 应 收 款 排名 TOP10 客 户 份额 
刘 晶 ，1.889%6 陈 挡 军 ， pt 


文字 ，1.6% 徐 


莲 凤 凤 ，1.93% 





图 6-8 按 一 个 指标 的 排名 和 份额 
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0 6000% 12000% 18000% 24000% 30000% 


图 6-8 〈( 续 ) 


6.4.3 销售 数据 分 析 


销售 数据 分 析 主 要 对 企业 与 销售 有 关 的 业务 数据 进行 分 析 ， 这 些 业务 
包括 销售 、 发 货 、 出 库 、 退 货 等 。 

销售 数据 分 析 的 维度 及 相关 层次 结构 定位 为 : 

(1) 时 间 : 可 具体 分 级 为 年 、 月 、 日 。 

(2) 业务 流程 (业务 类 型 ): 可 具体 分 级 为 所 有 、 具 体 业务 流程 。 

(3) 地 区 客户 : 可 具体 分 级 为 所 有 、 地 区 、 客 户 名 称 。 

(4) 分 类 客户 :可 具体 分 级 为 所 有 、 分 类 、 客 户 名 称 。 

(5) 销售 部 门 : 可 具体 分 级 为 所 有 、 子 公司 、 销 售 部 门 。 

(6) 业务 员 : 可 具体 分 级 为 所 有 、 子 公司 、 部 门 、 业 务 员 。 

(7) 存货 : 可 具体 分 级 为 所 有 、 存 货 分 类 (可 以 有 多 层次 的 分 类 ) 、 
存货 名 称 。 

(8) 存货 系列 : 可 具体 分 级 为 所 有 、 系 列 名 称 、 存 货 名 称 。 

下 面 按 销售 流程 ， 介 绍 销售 数据 分 析 显 示 的 数据 指标 : 

(1) 销售 合同 ， 它 在 销售 业务 流程 中 是 个 可 选 流程 ， 不 是 所 有 的 销售 
业务 中 都 有 销售 合同 。 与 销售 合同 有 关 的 指标 有 最 高 销售 金额 和 最 低 销 售 
金额 ， 最 高 销售 金额 为 销售 合同 中 销售 金额 最 大 的 一 笔 的 单 笔 金额 数 ， 最 


低 销 售 金额 为 销售 合同 中 销售 金额 最 小 的 一 笔 的 单 笔 金额 数 。 

(2) 销售 订单 ， 它 是 企业 和 客户 确认 要 货 需求 的 单据 ， 一 般 都 有 销售 
订单 和 销售 订单 明细 组 成 。 与 销售 订单 有 关 的 指标 有 订单 数量 和 订单 金额 ， 
订单 数量 为 销售 订单 模块 中 的 订单 数量 ， 可 以 分 为 汇总 数量 和 明细 数量 ， 
汇总 数量 读 取 一 个 订单 的 多 个 存货 的 数量 之 和 ; 明细 数量 读 取 每 个 存货 的 
订单 数量 。 订 单 金额 为 销售 订单 模块 中 的 订单 金额 ， 可 以 分 为 汇总 金额 和 
明细 金额 ， 汇 总 金额 读 取 一 个 订单 的 多 个 存货 的 金额 之 和 ， 明 细 金 额 读 取 
每 个 存货 的 订单 金额 。 

(3) 销售 发 货 ， 它 是 企业 执行 销售 订单 ， 将 货物 发 往 客户 的 行为 ， 销 
售 发 货 单 和 发 货 单 明细 是 客户 发 货 的 凭据 ， 指 标 中 的 数据 也 来 源 于 此 。 销 
售 发 货 的 指标 有 发 货 数量 和 发 货 金 额 ， 发 货 数量 为 销售 发 货 单 的 数量 ， 发 
货 金额 为 销售 发 货 单 的 金额 。 

(4) 申请 退货 ， 主 要 体现 的 是 销售 发 货 后 ， 客 户 退 货 的 申请 情况 ， 申 
请 退货 的 凭据 有 退货 申请 和 退货 申请 单 明细 。 申 请 退货 的 指标 有 申请 退货 
数量 和 申请 退货 金额 ， 申 请 退货 数量 为 销售 退货 申请 单 中 的 数量 ， 申 请 退 
货 金额 为 销售 退货 申请 单 中 的 金额 。 

(5) 销售 出 库 ， 主 要 的 单据 是 销售 出 库 单 ， 它 是 销售 出 库 业 务 的 主 
要 凭据 ， 在 库存 管理 系统 中 用 于 存货 出 库 数 量 、 金 额 的 核算 。 销 售 出 库 的 
指标 有 销售 数量 、 销 售 金额 、 销 售 计划 达成 率 、 客 户 数量 、 存 货品 种 数量 ， 
销售 数量 为 销售 出 库 单 中 的 数量 ， 销 售 金额 为 销售 出 库 单 中 的 金额 ， 销 售 
计划 达成 率 为 实际 销售 金额 /计划 销售 金额 ， 客 户 数量 为 在 指定 时 间 内 销 
售 出 库 模块 〈 每 单 出 库 数量 大 于 N) 的 客户 的 个 数 ， 存 货品 种 数量 为 在 指 
定时 间 段 内 销售 出 库 模块 的 存货 品种 〈 存 货 合计 出 库 大 于 N) 个 数 。 

(6) 销售 退货 ， 主 要 的 单据 是 销售 出 库 单 中 出 库 数量 为 负数 的 单据 。 
销售 出 库 的 指标 有 退货 数量 和 退货 金额 ， 退 货 数 量 为 销售 实际 退货 的 数量 ， 
退货 金额 为 销售 实际 退货 的 金额 。 

大 多 数 基本 指标 都 可 以 显示 同比 或 环比 数据 ， 称 为 计算 指标 ， 计 算 指 
标 跟 查询 维度 和 基本 指标 有 关 ， 下 面 以 客户 维度 的 销售 金额 为 例 说 明 ， 其 
他 维度 的 其 他 基本 指标 的 计算 相同 。 
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(1) 销售 金额 同比 增长 率 : 销售 出 库 金额 的 同比 值 ， 月 同比 增长 率 为 
跟 上 一 年 本 月 的 销售 出 库 金额 比较 ; 日 同比 增长 率 为 跟 上 一 年 这 一 天 销售 
出 库 金 额 比较 。 

(2) 销售 金额 环比 增长 率 : 销售 出 库 金 额 的 环比 值 ， 月 环比 为 跟 本 年 
的 上 个 月 销售 金额 比较 ; 日 环比 为 跟前 一 天 销售 金额 比较 。 

(3) 销售 金额 TOP10 客户 : 销售 出 库 金额 最 高 的 前 十 个 客户 ， 二 级 
页 面 中 主要 针对 这 10 个 客户 做 详细 的 分 析 。 

(4) 本 期 销售 金额 : 销售 出 库 金额 最 高 的 前 十 个 客户 的 本 期 销售 金额 。 

(5) 同期 销售 金额 : 销售 出 库 金 额 最 高 的 前 十 个 客户 的 上 一 年 同期 的 
销售 金额 。 

(6) 销售 金额 同比 %: 销售 出 库 金 额 最 高 的 前 十 个 客户 的 同比 增长 率 ; 
同比 : 月 同比 〈 跟 上 一 年 本 月 比较 ) 、 日 同比 〈 跟 上 一 年 这 一 天 比较 ) ; 
销售 金额 的 同比 查看 的 是 本 维度 的 同比 值 。 

(7) TOP10 份额 : 销售 金额 最 高 的 前 十 个 客户 关于 销售 金额 的 占 比 情况 。 

(8) TOP10 客户 的 时 间 走 势 : 销售 金额 最 高 的 前 十 个 客户 的 关于 销 
售 金额 的 总 额 以 及 销售 金额 的 时 间 走 势 〈 当 期 为 全 部 时 ， 查 看 各 个 年 份 的 
走势 ， 当 日 期 为 年 时 ， 查 看 本 年 各 个 月 份 的 走势 ， 当 日 期 为 月 时 ， 查 看 本 
年 1 月 至 当月 的 走势 ， 当 日 期 为 日 时 ， 查 看 本 月 1 号 到 本 日 的 走势 ) 。 

(9) 同比 TOP10: 销售 金额 同比 增长 最 快 的 前 十 个 客户 (客户 为 同 
期 销售 金额 排名 的 前 70% 的 客户 ) ， 月 同比 为 跟 上 一 年 本 月 比较 ， 日 同比 
为 跟 上 一 年 这 一 天 比较 。 

(10) 同比 BOTTOMI10: 销售 金额 同比 增长 最 慢 的 前 十 个 客户 〈 客 
户 为 同期 销售 金额 排名 的 前 70% 的 客户 ) ， 月 同比 为 跟 上 一 年 本 月 比较 ， 
日 同比 为 跟 上 一 年 这 一 天 比较 。 

(11) 环比 TOP10: 销售 金额 环比 增长 最 快 的 前 十 个 客户 (客户 为 上 
期 销售 金额 排名 的 前 70% 的 客户 ) ， 月 环比 为 跟 本 年 的 上 个 月 比较 , 日 环 
比 为 跟前 一 天 比较 。 

(12) 环比 BOTTOM10: 销售 金额 环比 增长 最 慢 的 前 十 个 客户 ( 客 
户 为 上 期 销售 金额 排名 的 前 70% 的 客户 )， 月 环比 为 跟 本 年 的 上 个 月 比较 ， 


日 环比 为 跟前 一 天 比较 。 


6.4.4 毛利 数据 分 析 


毛利 涧 是 企业 的 运营 收入 之 根本 ， 只 有 毛利 率 高 的 企业 才 有 可 能 拥有 
高 的 净利 润 。 毛 利率 在 一 定 程度 上 可 以 反映 企业 的 持续 竞争 优势 如 何 。 毛 
利 数 据 分 析 把 由 财务 报表 上 一 串 串 毛利 数字 ， 变 成 了 直观 的 图 形 化 的 展示 。 
可 以 直接 看 到 这 些 数字 产生 的 原因 。 

毛利 数据 分 析 从 时 间 、 业 务 流程 、 地 区 客户 、 分 类 客户 、 销 售 部 门 、 
业务 员 、 存 货 维 度 多 个 方面 分 析 货 物 的 出 库 、 财 务 成 本 、 实 际 成 本 的 数据 ， 
从 而 可 以 比较 出 实际 成 本 和 财务 成 本 之 间 的 差异 ， 得 出 实际 的 毛利 率 和 财 
务 毛 利率 。 

毛利 数据 分 析 的 查询 维度 及 相关 层次 结构 定位 为 : 

(1) 时 间 : 可 具体 分 级 为 年 、 月 、 日 。 

(2) 业务 流程 (业务 类 型 》: 可 具体 分 级 为 所 有 、 具 体 业务 流程 。 

(3) 地 区 客户 : 可 具体 分 级 为 所 有 、 地 区 、 客 户 名 称 。 

(4) 分 类 客户 : 可 具体 分 级 为 所 有 、 分 类 、 客 户 名 称 。 

(5) 销售 部 门 : 可 具体 分 级 为 所 有 、 子 公司 、 销 售 部 门 。 

(6) 业务 员 : 可 具体 分 级 为 所 有 、 子 公司 、 部 门 、 业 务 员 。 

(7) 存货 : 可 具体 分 级 为 所 有 、 存 货 分 类 (可 以 有 多 层次 的 分 类 ) 、 
存货 名 称 。 

(8) 存货 系列 : 可 具体 分 级 为 所 有 、 系 列 名 称 、 存 货 名 称 。 

毛利 数据 分 析 显 示 了 以 下 指标 的 数据 : 

(1) 销售 数量 : 销售 出 库 单 中 的 数量 。 

(2) 销售 无 税金 额 〈 销 售 收入 ) : 销售 出 库 无 税金 额 ( 出 库 数量 X 销 
售 订单 中 的 不 含 税 单价 ) 。 

(3) 销售 价 税 合计 《销售 金额 ) : 销售 出 库 含 税金 额 ( 出 库 数量 x 销 
售 订 单 中 的 含 税 单价 )。 

(4) 销售 税额 : 销售 价 税 合计 一 销售 无 税金 额 。 
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(5) 实际 成 本 单价 : 根据 企业 生产 管理 中 的 数据 计算 。 

(6) 财务 成 本 : 出 库 数 量 xX 财务 成 本 单价 〈 出 库 单价 ， 无 税 ) 。 

(7) 实际 成 本 : 出 库 数量 x 实际 成 本 单价 /1.17[ 出 库 订 单 、 出 库 订 
单 明细 〈 无 税 ) ]。 

(8) 财务 毛利 : 销售 收入 一 财务 成 本 。 

(9) 实际 毛利 : 销售 收入 一 实际 成 本 。 

(10) 财务 毛利 率 : 财务 毛利 / 销售 收入 X 100%。 

(11) 实际 毛利 率 : 实际 毛利 / 销售 收入 X 100%。 

以 上 大 多 数 基 本 指标 都 可 以 显示 同比 或 环比 等 计算 指标 ， 计 算 指 标 值 
跟 查 询 维度 和 基本 指标 有 关 ， 具 体 可 以 获得 哪些 计算 指标 ， 可 参考 销售 数 
据 分 析 中 的 例子 。 


6.4.5 应 收 款 数据 分 析 


应 收 款 数 据 分 析 主 要 展示 了 企业 销售 业务 后 ， 对 客户 的 形成 的 应 收 款 
金额 、 已 收 款 金额 、 收 款 余额 以 及 账 龄 等 数据 的 分 析 和 图 形 的 展示 。 能 比 
较 直观 地 反映 出 每 一 个 客户 的 账 款 情况 。 从 时 间 、 地 区 客户 、 分 类 客户 、 
销售 部 门 、 业 务 员 五 个 条 件 分 析 应 收 丈 、 已 收 款 、 账 龄 等 数据 。 

应 收 坎 数据 分 析 的 维度 及 相关 的 层次 结构 定义 为 : 

(1) 时 间 : 可 具体 分 级 为 年 、 月 、 日 。 

(2) 业务 流程 〈 业 务 类 型 ) : 可 具体 分 级 为 所 有 、 具 体 业务 流程 。 

(3) 地 区 客户 :可 具体 分 级 为 所 有 、 地 区 、 客 户 名 称 。 

(4) 分 类 客户 :可 具体 分 级 为 所 有 、 分 类 、 客 户 名 称 。 

(5) 销售 部 门 : 可 具体 分 级 为 所 有 、 子 公司 、 销 售 部 门 。 

(6) 业务 员 : 可 具体 分 级 为 所 有 、 子 公司 、 部 门 、 业 务 员 。 

(7) 账 龄 : 可 具体 分 级 为 所 有 、 账 龄 (0 ~ 30 天 、30 ~ 60 天 ， 
60 一 90 天，90 天 以 上 ， 也 可 以 自 定 义 〉。 

下 面 按 应 付款 流程 ， 介 绍 应 收 款 数 据 分 析 显 示 的 数据 指标 : 

(1) 销售 出 库 ， 主 要 的 单据 是 销售 出 库 单 ， 它 是 销售 出 库 业 务 的 主要 


凭据 ， 在 库存 管理 系统 中 用 于 存货 出 库 数量 、 金 额 的 核算 ， 也 是 应 收 款 账 
单 形成 的 依据 。 销 售 出 库 的 指标 有 销售 数量 和 销售 金额 ， 销 售 数量 为 销售 
出 库 单 中 的 数量 ， 销 售 金额 为 销售 出 库 单 中 的 金额 。 

(2) 销售 退货 ， 主 要 的 单据 是 销售 出 库 单 中 出 库 数量 为 负数 的 单据 。 
销售 退货 的 指标 有 退货 数量 和 退货 金额 ， 退 货 数 量 为 销售 实际 退货 的 数量 ， 
退货 金额 为 销售 实际 退货 的 金额 。 

(3) 销售 开票 ， 是 在 销售 过 程 中 ， 由 企业 向 客户 开具 销售 发 票 以 及 
发 票 明细 的 过 程 ， 它 是 销售 收入 和 应 收 账户 确认 的 依据 。 销 售 开 票 的 指标 
有 开票 金额 、 开 票 价 税 合计 、 开 票 税 额 ， 开 票 金额 为 销售 开票 的 无 税金 额 ， 
开票 价 税 合 计 为 销售 开票 的 含 税金 额 ， 开 票 税额 为 销售 开票 的 税额 。 

(4) 应 收 账 款 ， 是 企业 的 往来 管理 系统 ， 通 过 单据 应 收 单 来 形成 客户 
的 应 收 账 单 。 应 收 账 款 的 指标 有 应 收 余额 、 信 用 额度 、 超 期 客户 数 、 超 额 
金额 、 期 初 余额 、 平 均 账 龄 、 平 均 超 账 期 账 龄 。 

应 收 余额 为 期 末 未 核 销 的 累计 应 收 金 额 ， 信 用 额度 为 在 客户 设置 的 额 
度 中 最 后 一 个 有 效 记 录 ， 超 期 客户 数 为 未 核 销 应 付款 中 指定 日 期 超过 账 期 
结束 日 的 客户 数 〈 超 账 期 金额 大 于 等 于 N 元 ) ， 超 额 金额 = 应 收 账 款 余额 一 
信用 人 额度， 期初 余额 为 上 一 期 期 末 的 金额 。 

平均 账 龄 为 单 笔 应 收 款 账 龄 的 加 权 平 均值 ， 而 单 笔 应 收 款 账 龄 二 每 笔 
欠 款 天 数 〈 指 定 日 一 应 收音 日 期 ， 单 笔 应 收 账 款 是 指 与 收 款 核 销 后 未 付 
款 的 应 收 账 款 ， 应 收 单 日 期 是 信用 账 期 起 始 日 。 

平均 超 账 期 账 龄 为 平均 欠 款 天 数 一 平均 账 期 天 数 。 

平均 账 期 天 数 为 应 收 账 款 账 期 天 数 加 权 平 均值 ， 应 收 账 款 账 期 天 数 为 
账单 的 到 期 日 减 去 账 期 起 效 日 (应 收 单 的 日 期 )。 

(5) 收 款 单 ， 用 来 记录 企业 所 收 到 的 客户 款项 。 收 款 单 的 指标 有 收 款 
金额 ， 收 款 金额 为 单据 明细 中 的 收 款 金额 。 

以 上 大 多 数 基本 指标 都 可 以 显示 同比 或 环比 等 计算 指标 ， 计 算 指标 值 
跟 查 询 维度 和 基本 指标 有 关 ， 具 体 可 以 获得 哪些 计算 指标 ， 可 参考 销售 数 
据 分 析 中 的 例子 。 
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6.4.6 采购 数据 分 析 


采购 管理 是 企业 供应 链 的 重要 组 成 部 分 ， 采 购 数据 分 析 对 采购 的 合同 、 
订单 、 到 货 、 入 库 、 开 票 和 采购 结算 的 数量 、 金 额 进行 对 比分 析 和 图 形 展 
示 ， 在 分 析 图 形 中 还 对 采购 的 计划 达成 率 、 商 品 到 货 的 合格 率 进行 了 分 析 ， 
对 采购 合同 中 的 最 高 、 最 低 、 平 均 价 格 做 了 比较 。 

采购 数据 分 析 的 维度 及 其 相关 的 层次 结构 定义 如 下 : 

(1) 时 间 : 可 具体 分 级 为 年 、 月 、 日 。 

(2) 业务 流程 (业务 类 型 》: 可 具体 分 级 为 所 有 、 业 务 流程 。 

(3) 供应 商 : 可 有 具体 分 级 为 所 有 、 地 区 、 供 应 商 名 称 。 

(4) 存货 : 可 具体 分 级 为 所 有 、 分 类 《多 个 分 类 ) 、 存 货 名 称 。 

(5) 采购 部 门 : 可 具体 分 级 为 所 有 、 子 公司 、 采 购 部 门 。 

下 面 按 采 购 业 务 流程 ， 介 绍 采购 数据 分 析 显 示 的 数据 指标 : 

(1) 采购 请 购 ， 是 采购 业务 处 理 的 起 点 ， 企 业内 部 像 采 购 部 门 提出 
采购 申请 ， 生 成 采购 请 购 单 和 请 购 单 明细 。 该 流程 也 是 自选 流程 ， 可 以 选 
择 是 否 需要 使 用 。 采 购 请 购 的 指标 有 采购 请 购 数量 、 最 高 价格 、 最 低 价格 、 
平均 价格 、 整 体 平均 价格 ， 采 购 请 购 数量 为 采购 请 购 单 中 的 货物 数量 ， 最 
高 价格 为 采购 请 购 明 细 单 中 〈 数 量 > NW， 单 价 > N) 货物 的 最 高 单价 ， 最 
低 价格 为 采购 请 购 明细 单 中 《数量 > NW， 单 价 > N) 货物 的 最 低 单价 ， 平 
均 价 格 为 采购 购 明 细 单 中 〈 数 量 > N， 单 价 > N) 的 合同 记录 ， 计 算 货物 
采购 加 权 平 均 单 价 ， 整 体 平 均 价 格 为 根据 采购 请 购 单 计算 所 有 供应 商 的 加 
权 平 均 价格 ， 所 有 供应 商 的 无 税 采 购 总 金额 /采购 总 数量 。 

(2) 采购 订单 ， 是 整个 采购 业务 的 核心 ， 通 过 采购 订单 可 以 跟踪 采购 
的 整个 业务 流程 ， 主 要 的 单据 有 采购 订单 和 采购 订单 明细 。 采 购 订 单 的 指 
标 有 订单 数量 和 订单 金额 ， 订 单数 量 为 采购 订单 中 的 数量 ， 包 括 总 数量 和 
明细 数量 ， 订 单 金额 为 采购 订单 金额 ,包括 总 金额 和 明细 金额 。 

(3) 采购 到 货 ， 它 是 采购 订单 和 采购 入 库 的 中 间 环 节 ， 确 认 对 方 所 送 
货物 的 数量 、 价 格 和 金额 等 信息 , 确认 后 传递 到 仓库 , 该 流程 也 是 可 选 流程 ， 
根据 自己 的 业务 需要 选择 。 采 购 到 货 的 指标 有 到 货 数量 、 到 货 金 额 、 到 货 


合格 数量 、 到 货 合 格 率 ， 到 货 数 量 为 采购 到 货 单 中 数量 ， 包 括 总 数量 和 明 
细 数 量 ， 到 货 金 额 为 采购 到 货 单 中 人 金额， 包括 总 金额 和 明细 金额 ， 到 货 合 
格 数量 为 采购 到 货 后 经 过 检验 合格 后 的 最 终 到 货 数 量 ， 到 货 合格 率 为 到 货 
合格 数量 / 到 货 数量 X 100%。 

(4) 采购 入 库 ， 仓 库 收 到 采购 的 货物 ， 仓 库 将 验收 货物 的 数量 ， 确 认 
后 入 库 ， 主 要 单据 有 采购 入 库 单 和 采购 入 库 明 细 单 。 采 购 入 库 的 指标 有 入 
库 数量 、 入 库 金 额 、 采 购 计划 达成 率 、 供 应 商 数 、 存 货品 种 数 。 入 库 数量 
为 采购 入 库 单 的 数量 ， 入 库 金额 为 采购 入 库 单 的 金额 ， 采 购 计 划 达 成 率 为 
采购 入 库 数量 /采购 合同 数量 X100%， 供 应 商 数 为 在 指定 时 间 内 有 交易 采 
购 入 库 模 块 的 供应 商 的 个 数 ， 存 货品 种 数 为 在 指定 时 间 内 采购 入 库 模块 涉 
及 的 存货 品种 个 数 。 

(5) 采购 退货 ， 采 购 到 货 不 合格 的 货物 ， 生 成 采购 退货 单 。 采 购 退 货 
的 指标 有 退货 数量 和 退货 金额 。 退 货 数 量 为 采购 退货 单 的 数量 ， 退 货 金 额 
为 采购 退货 单 的 金额 。 

(6) 采购 开票 ， 是 供应 商 开 出 的 销售 货物 的 发 票 ， 是 销售 货物 的 凭证 。 
采购 开票 的 指标 有 开票 数量 、 开 票 税额 、 开 票 价 税 合 计 。 开 票数 量 为 采购 
开票 单 的 数量 ， 开 票 税额 为 采购 开票 单 的 税额 ， 开 票 价 税 合计 为 采购 开票 
的 总 金额 。 

(7) 采购 结算 ， 即 采购 报账 ， 是 采购 核算 人 员 跟 进 采购 入 库 单 和 采购 
发 票 核算 生成 的 ， 单 据 为 采购 结算 单 和 结算 单 明细 。 采 购 结算 的 指标 有 结 
算数 量 和 结算 金额 。 结 算数 量 为 采购 结算 单 的 数量 ， 结 算 金 额 为 采购 结算 
单 的 金额 。 

以 上 大 多 数 基本 指标 都 可 以 显示 同比 或 环比 等 计算 指标 ， 计 算 指标 值 
跟 查 询 维度 和 基本 指标 有 关 ， 具 体 可 以 获得 哪些 计算 指标 ， 可 参考 销售 数 
据 分 析 中 的 例子 。 


6.4.7 应 付款 数据 分 析 


应 付款 数据 分 析 主 要 展示 了 企业 采购 业务 后 ， 对 供应 商 的 形成 的 应 付 
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款 金 额 、 已 付款 金额 、 付 款 余额 以 及 账 龄 等 数据 的 分 析 和 图 形 的 展示 。 能 
比较 直观 地 反映 出 每 一 个 供应 商 的 账 款 情况 。 

应 付款 数据 分 析 从 时 间 、 供 应 商 、 存 货 、 采 购 部 门 、 结 算 方式 五 个 维 
度 分 析 应 付款 、 已 付款 数据 。 维 度 及 相关 层次 结构 的 定义 为 : 

(1) 时 间 : 可 具体 分 级 为 年 、 月 、 日 。 

(2) 业务 流程 (业务 类 型 》: 可 具体 分 级 为 所 有 、 业 务 流程 。 

(3) 供应 商 : 可 具体 分 级 为 所 有 、 地 区 、 供 应 商 名 称 。 

(4) 采购 部 门 : 可 具体 分 级 为 所 有 、 子 公司 、 采 购 部 门 。 

(5) 结算 方式 : 可 具体 分 级 为 所 有 、 结 算 方式 。 

下 面 按 按 应 付款 流程 ， 介 绍 应 付款 数据 分 析 显 示 的 数据 指标 : 

(1) 采购 入 库 ， 仓 库 收 到 采购 的 货物 ， 仓 库 将 验收 货物 的 数量 ， 确 认 
后 入 库 ， 主 要 单据 有 采购 入 库 单 和 采购 入 库 明细 单 。 采 购 入 库 的 指标 有 采 
购 单 价 、 入 库 数量 、 入 库 金 额 。 采 购 单价 为 采购 订单 含 税 单价 ， 入 库 数量 
为 采购 入 库 单 的 数量 ， 入 库 金 额 为 采购 入 库 单 的 金额 。 

(2) 采购 开票 ， 是 供应 商 开 出 的 销售 货物 的 发 票 ， 是 销售 货物 的 凭证 。 
采购 开票 的 指标 有 开票 数量 、 开 票 税额 、 开 票 价 税 合计 。 开 票数 量 为 采购 
开票 单 的 数量 ， 开 票 税 额 为 采购 开票 单 的 税额 ， 开 票 价 税 合计 为 采购 开票 
的 总 金额 。 

(3) 采购 结算 ， 即 采购 报账 ， 是 采购 核算 人 员 跟 进 采购 入 库 单 和 采购 
发 票 核算 生成 的 ， 单 据 为 采购 结算 单 和 结算 单 明 细 。 采 购 结算 的 指标 有 结 
算数 量 、 结 算 金 额 、 结 算 单价 。 结 算数 量 为 采购 结算 单 上 的 数量 ， 结 算 金 
额 为 采购 结算 金额 ， 结 算 单 价 为 采购 结算 单 对 应 的 开票 含 税 单价 。 

(4) 应 付 账 款 ， 是 企业 的 往来 管理 系统 ， 通 过 单据 应 付 单 来 形成 客户 
的 应 付 账单 。 应 付 账 款 的 指标 有 应 付 余额 、 超 账 期 应 付款 余额 、 应 付 余额 
平均 账 龄 、 平 均 超 账 期 账 龄 、 平 均 账 期 天 数 、 提 前 付款 的 供应 商 数 、 提 前 
付款 金额 、 付 款 计划 达成 率 。 

应 付 余 额 为 期 末 未 核 销 的 累计 应 付 金额 ， 超 账 期 应 付款 余额 为 期 末 超 
过 账 期 未 核 销 的 应 付款 金额 。 

应 付 余额 平均 账 龄 为 应 付 账 款 账 龄 的 加 权 平 均值 ， 单 笔 应 付 账 款 账 龄 = 


每 笔 从 款 天 数 〈 指 定 日 一 应 付 单 日 期 * ， 应 收 付款 是 指 与 付款 核 销 后 未 收 
款 的 应 付 账 款 。 

平均 超 账 期 账 龄 为 平均 欠 款 天 数 一 平均 账 期 天 数 。 

平均 账 期 天 数 为 应 付 账 款 账 期 天 数 加 权 平 均值 ， 应 付 账 款 账 期 天 数 为 
账单 的 到 期 日 一 账 期 起 效 日 (应 付 单 的 日 期 ， 单 个 应 付 账 款 是 指 与 收 款 
核 销 后 未 付款 的 应 付 账 款 。 

提前 付款 的 供应 商 数 为 核 销 日 期 在 到 期 日 之 前 供应 商 数量 ， 提 前 付款 
金额 为 核 销 日 期 在 到 期 日 之 前 的 付款 合计 金额 ， 付 款 计划 达成 率 为 付款 计 
划 达 成 率 二 实际 付款 额 / 应 付款 额 ， 应 付款 额 三 查询 期 期 初 的 应 付 余 额 十 
查询 期 的 应 付 金额 - 查询 期 期 末 未 到 期 金额 。 

(5) 付款 单 ， 用 来 记录 向 供应 商 付款 的 款项 。 付 款 单 的 指标 有 已 付款 
金额 ， 已 付款 金额 为 单据 明细 中 的 付款 金额 。 


6.4.8 库存 数据 分 析 


库存 管理 系统 是 一 个 企业 、 单 位 不 可 缺少 的 部 分 ， 它 的 内 容 对 于 企业 
的 决策 者 和 管理 者 来 说 都 是 至 关 重 要 的 。 库 存 数 据 分 析 主 要 从 时 间 、 仓 库 、 
入 出 库 方式 、 存 货 、 存 货 系 列 、 库 龄 等 多 方面 查询 度 分析 库 存 数据 和 图 标 
的 展示 。 通 过 分 析 系 统 可 以 让 管理 部 门 直观 地 全 方位 地 看 到 库存 的 信息 ， 
这 样 既 可 以 保证 日 常 的 生产 不 至 于 因为 原材料 不 足 而 导致 停产 ， 确 保生 产 
顺利 进行 ， 也 可 以 使 企业 不 会 因原 材料 的 库存 数量 过 多 而 积压 企业 的 流动 
资金 ， 从 而 提高 企业 的 经 济 效益 。 

库存 数据 分 析 从 以 下 维度 及 相关 的 层次 结构 进行 分 析 。 

(1) 时 间 : 可 具体 分 级 为 年 、 月 、 日。 

(2) 仓库 : 可 具体 分 级 为 所 有 、 仓 库 名 称 。 

(3) 出 入 库 类 型 : 可 具体 分 级 为 所 有 、 出 入 库 类 型 。 

(4) 库 龄 : 可 具体 分 级 为 所 有 、 库 龄 。 

(5) 存货 : 可 具体 分 级 为 所 有 、 分 类 (多 层次 分 类 ) 、 存 货 名 称 。 

(6) 存货 系列 : 可 具体 分 级 为 所 有 、 系 列 名 称 、 存 货 名 称 。 
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下 面 按 入 出 库 流程 ， 介 绍 入 出 库 有 关 的 数据 指标 : 

(1) 入 库 业 务 : 仓库 收 到 采购 或 生产 的 货物 ， 保 管 员 将 验收 后 的 数量 
等 信息 确认 后 入 库 ， 单 据 主要 包括 采购 入 库 单 、 产 成 品 入 库 单 和 其 他 入 库 
单 。 入 库 业 务 的 指标 有 入 库 数 量 、 入 库 金 额 、 入 库 平 均 单价 。 入 库 数 量 为 
货物 入 库 单 上 的 数量 ， 入 库 金 额 为 货物 入 库 单 上 的 金额 ， 入 库 平均 单价 为 
加 权 平 均 单价 ， 入 库 总 金额 / 入 库 总 数量 。 

(2) 出 库 业 务 : 其 指标 有 出 库 数量 、 出 库 金 额 、 出 库 平均 单价 。 出 
库 数 量 为 货物 出 库 单 上 的 出 库 数 量 ， 出 库 金 额 为 货物 出 库 单 上 的 出 库 金 额 ， 
出 库 平均 单价 为 加 权 平 均 单价 ， 出 库 总 金额 /出 库 总 数量 。 

库存 数据 分 析 通 过 复杂 的 处 理 ， 生 成 并 显示 了 以 下 指标 。 

(1) 期 末 库 存 数 : 本 期 最 后 一 天 的 库存 数量 。 

(2) 库存 平均 数量 : 每 天 库存 数量 之 和 / 天 数 。 

(3) 平均 库存 金额 : 每 天 库存 金额 之 和 / 天 数 。 

(4) 库存 余额 : 本 期 最 后 一 天 的 库存 金额 。 

(5) 财务 库存 毛利 ; 销售 标准 价 xX 库存 数量 一 财务 库存 成 本 。 

(6) 实际 库存 毛利 ; 销售 标准 价 xX 库存 数量 一 实际 库存 成 本 。 

(7) 当天 标准 售 价 :最 新 销售 价格 一 销售 调价 单 、 销 售 调价 明细 单 
取 当 天 的 零售 价 ， 如 果 取 不 到 该 价格 ， 就 读 取 最 近 一 次 的 销售 价格 〈 离 选 
定 日 期 最 近 的 一 次 ) 。 

(8) 进货 价 〈 入 库 价 ): 最 近 一 次 入 库 单价 。 

(9) 财务 库存 潜 亏 : 》〈 进 货 价 x 库存 数量 ) 一 财务 库存 成 本 。 

(10) 实际 库存 潜 亏 : 》 (进货 价 X 库存 数量 ) 一 实际 库存 成 本 。 

(11) 平均 日 销售 数量 : 指定 日 期 前 15 天 的 销售 总 数量 /15。 

(12) 可 销售 天 数 : 库存 数量 /平均 日 销售 数量 (最 近 15 天 平均 出 库 
数量 ) 。 

(13) 平均 库 龄 : 根据 入 库 日 期 倒 排 序 物料 ， 用 库存 总 数 去 对 比 入 库 
数量 ， 找 到 符合 条 件 的 多 条 记录 〈 如 图 6-9 所 示 ， 符 合 条 件 的 3 条 ) 。 


序号 入 库 日 其 | 。 入 库 数 量 。。 | 入 库 单价 库存 (2015-12_29) 


100 


[4| 12 有 8| so | | 
| 5| uAzBl zo0 | | 
[el uAsB| al | | 





图 6-9 平均 库 龄 计算 


分 别 计算 这 3 条 记录 中 的 入 库 单价 、 数 量 、 天 数 (当天 一 入 库 日 期 ) ， 用 (每 笔 
的 库存 天 数 X 每 笔 的 数量 ) 之 和 / 总 库存 数量 ， 得 到 库 龄 ; 〈4X50 十 6X40 十 
11X10) /100 = 5.5 (天 ) 。 

(14) 财务 库存 成 本 : 每 笔 财 务 入 库 单价 X 每 笔 入 库 数量 之 和 : 50X3.5 十 
40X2.8 十 10X4.2 二 329 (万 元 ) 。 

(15) 实际 库存 成 本 每 笔 实际 入 库 单价 x 每 笔 入 库 数量 之 和 : 50X 
3.5 十 40X2.8 十 10X4.2 = 329 (万 元 ) 。 

(16) 期 初 库存 数 : 上 一 期 的 期 末 库 存 数 。 

以 上 大 多 数 基本 指标 都 可 以 显示 同比 或 环比 等 计算 指标 ， 计 算 指标 值 
跟 查询 维度 和 基本 指标 有 关 ， 具 体 可 以 获得 哪些 计算 指标 ， 可 参考 销售 数 
据 分 析 中 的 例子 。 


6.5 与 上 市 公司 外 部 数据 比较 


在 企业 决策 中 可 以 利用 的 数据 有 两 部 分 : 一 部 分 是 内 部 数据 ， 另 一 部 
分 是 外 部 数据 。 内 部 数据 一 般 是 来 自 以 ERP 为 核心 的 企业 信息 系统 ， 包 
括 财务 数据 、 经 营 数据 、 生 产 数据 和 一 些 控制 数据 ， 分 别 来 自 财务 软件 、 
ERP 软件 、MES 软件 和 底层 的 DCS 等 控制 系统 的 软件 。 这 些 内 部 数据 相 
对 而 言 比较 详细 、 准 确 , 也 没有 数据 安全 、 使 用 权限 问题 , 而 且 粒 度 比 较 细 。 
对 内 部 数据 可 以 采取 纵向 比较 ， 即 按照 时 间 进 行 比较 分 析 。 做 数据 分 析 的 
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另 一 种 方式 叫 横 向 比较 ， 就 是 和 你 的 同行 进行 比较 。 同 行 比较 最 主要 的 问 
题 就 是 缺少 同行 的 数据 ， 好 在 如 果 同 行 已 经 上 市 ， 它 根据 证 监 会 的 要 求 ， 
需要 定期 公布 经 营 数据 。 公 布 时 间 每 个 季度 一 次 ， 一 年 四 次 ， 包 括 第 一 季 
度 报告 、 半 年 报告 、 第 三 季度 报告 和 年 度 报告 ， 这 里 面 公开 了 很 多 的 经 营 
数据 。 

现在 炒股 的 人 一 般 都 关注 股价 的 数据 ， 对 经 营 数据 不 太 重视 ， 实 际 上 
从 价值 投资 角度 来 说 ， 应 该 重视 经 营 数据 。 企 业 分 析 自 己 在 同行 中 的 位 置 
时 ， 不 能 使 用 股价 数据 ， 只 能 用 经 营 数据 。 这 些 外 部 数据 以 季度 为 单位 ， 
没有 企业 内 部 数据 的 粒度 高 ， 所 以 进行 对 照 分 析 的 内 部 数据 也 只 需要 季度 
的 财务 数据 。 

经 营 数据 的 横向 比较 有 什么 价值 呢 ? 横向 比较 可 以 发 现 自身 不 足 ， 知 
道行 业 的 增长 速度 ， 看 看 自己 是 否 赶 上 或 超过 行业 的 平均 发 展 水 平 。 有 时 
虽然 自身 企业 的 增长 情况 不 错 ， 比 如 说 与 去 年 相 比 增长 10%， 如 果 这 个 行 
业 平 均 增长 20%， 那 么 10% 的 增长 速度 是 远 远 不 够 的 ， 有 可 能 表明 现在 市 
场 时 机 比较 好 ， 应 该 抓 住 这 个 机 会 进行 发 展 ， 若 是 不 能 抓 住 这 个 机 遇 ， 过 
段 时 间 你 的 规模 就 会 明显 地 落 在 同行 之 后 ， 会 被 行业 所 淘汰 。 有 了 横向 比 
较 才 能 做 到 心中 有 数 。 还 可 以 对 关键 指标 进行 同行 比较 ， 比 如 人均 销 售 额 、 
人 均 利 润 等 指标 ， 看 看 同行 的 企业 中 本 企业 的 劳动 生产 率 情况 如 何 ， 根 据 
行业 先进 水 平 对 企业 进行 调整 ， 对 自己 产品 的 价格 在 市 场 上 是 否 有 竞争 力 
做 到 心中 有 数 ， 若 是 发 现 差距 则 可 以 找到 差距 所 在 ， 比 如 说 人 员 总 数 太 多 
或 者 开发 人 员 占 比 太 少 等 原因 ， 及 时 进行 调整 。 

上 市 公司 定期 报告 数据 分 为 合并 报表 和 和 母 公司 报表 ， 作 为 同行 ， 主 要 
比较 母 公 司 报表 数据 。 

图 6-10 显示 四 个 同行 上 市 公司 几 个 数据 指标 的 对 比分 析 统计 图 形 。 
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图 6-10 上 市 公司 数据 对 比分 析 








6.6 控制 数据 分 析 


6. 6.1 从 工业 大 数据 中 找到 故障 


在 李 杰 的 《工业 大 数据 》 呈 一 书 中 ， 提 出 了 一 些 非常 有 价值 的 理念 : 
现在 工业 企业 中 处 理 的 问题 都 是 已 经 发 生 的 问题 ， 已 经 发 生 的 故障 。 怎 样 
解决 没有 发 生 的 故障 呢 ? 书 中 举 了 例子 ， 通 过 研究 ， 发 现 可 以 提前 十 多 天 
发 现 生产 流水 线 上 一 个 工业 机 器 人 故障 。 至 于 如 何 发 现 的 ， 书 中 没有 给 出 
具体 说 明 。 

实际 上 ， 每 个 故障 的 发 生 ， 都 是 一 些小 的 错误 积累 到 一 定 程度 的 结果 。 
通过 分 析 设 备 状态 多 种 数据 ， 只 要 找到 开始 的 一 些 数据 变化 ， 就 可 以 预测 
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故障 的 发 生 ， 甚 至 知道 故障 发 生 的 时 间 。 

如 果 一 个 生产 车 间 只 有 几 十 台 设 备 ， 就 可 以 逐个 观察 它 的 数据 ， 或 者 
通过 一 些 统计 软件 对 统计 数据 进行 分 析 ， 得 出 结论 。 但 如 果 一 个 企业 有 几 
千 、 几 万 台 设备 ， 怎 么 发 现 其 中 一 台 的 故障 呢 ? 

如 何在 这 么 多 数据 中 ， 几 千 台 设备 的 运行 数据 中 找到 这 个 问题 数据 ， 
这 是 一 个 大 数据 问题 ， 李 杰 的 书 中 并 没有 给 出 具体 方法 。 

工业 设备 的 数据 正常 情况 下 变化 不 大 ， 数 值 比较 稳定 。 作 为 一 种 采样 
数据 ， 采 样 间隔 如 果 是 10 秒 ， 每 个 采集 点 每 过 10 秒 钟 就 会 采集 一 个 数据 。 
设备 在 正常 运转 时 ， 这 种 数据 都 会 围绕 一 个 基准 值 波动 ， 也 就 是 说 大 量 的 
时 间 点 采集 和 大 量 的 设备 传 出 的 数据 都 是 没有 价值 的 。 如 果 直 接 处 理 这 些 
数据 ， 会 耗费 大 量 的 时 间 和 存储 空间 。 

可 以 为 同类 设备 同 种 采集 点 设置 一 个 基准 值 和 正 负 误差 范围 ,仅仅 把 
与 基准 值 有 偏差 的 数据 进行 抽取 ， 通 过 预 处 理 后 ， 然 后 把 这 个 值 放 到 数据 
仓库 中 去 ， 最 后 通过 建 模 ， 研 究 分 析 汇 总 数据 。 

这 个 模型 维度 主要 考虑 时 间 、 设 备 和 设备 类 型 ， 设 备 按 工 厂 可 以 分 为 
总 公司 、 分 公司 、 工 厂 、 车 间 、 车 间 区 域 、 设 备 号 。 

把 设备 数据 按 维度 进行 汇总 ， 最 终 决 策 者 看 到 的 数据 是 所 有 设备 汇总 
的 数据 ， 比 如 几 千 台 设备 汇总 后 得 到 的 一 个 平均 值 。 平 均值 可 能 是 一 天 的 
平均 值 ， 也 可 能 是 一 个 月 的 平均 值 ， 甚 至 是 更 长 的 一 年 的 平均 值 。 一 般 只 
需要 看 一 天 或 一 个 月 的 平均 值 。 对 工业 设备 来 说 ， 比 较 关注 一 天 的 平均 值 ， 
这 个 平均 值 既 可 能 是 在 时 间 维 度 的 平均 值 ， 也 可 能 是 在 设备 维度 的 平均 值 。 

要 发 现 故 障 ， 主 要 需要 关注 平均 值 环 比 或 者 同比 变化 。 因 为 不 可 能 所 
有 设备 一 起 发 生 故 障 ， 所 以 要 找 的 是 环比 或 同比 的 排名 ， 这 个 排名 可 以 从 
几 千 台 设 备 中 挑 出 变化 最 大 的 前 十 个 来 。 通 过 排名 关注 看 设备 状态 有 没有 
发 生变 化 。 

正常 情况 ， 环 比 应 该 是 零 或 接近 零 ， 比 如 是 百 分 之 0.001， 这 些 值 的 
排名 都 靠 后 。 如 果 有 一 台 设 备 发 生 故 障 ， 监 测 值 的 总 和 、 平 均值 、 同 比 或 
环比 值 肯定 会 发 生变 化 ， 但 因为 数据 太 多 ， 会 被 淹没 掉 ， 这 时 就 需要 看 排 
名 。 从 排名 中 看 到 ， 平 时 最 高 的 排名 环比 值 可 能 是 0.01%， 现 在 忽然 增加 


到 0.1% 或 者 1%。 看 到 这 种 情况 ， 就 可 以 马上 调 出 这 台 设 备 的 历史 数据 ， 
观察 它 在 时 间 维 度 上 的 走势 。 如 果 以 前 没有 类 似 故 障 的 数据 模型 ， 起 码 应 
该 对 设备 异常 引起 警觉 ， 加 强 观 察 或 马上 停机 检修 。 在 这 台 设 备 发 生 故 障 
或 检修 发 现 问 题 后 ， 可 以 把 这 台 设 备 的 异动 变化 数据 建 一 个 模型 保存 起 来 ， 
或 者 把 时 间 的 变化 做 一 个 截图 保存 起 来 ， 以 后 再 看 到 发 生 类 似 变 化 的 话 ， 
就 可 以 对 照 这 个 时 间 走 势 曲线 图 ， 大 概 知道 这 个 信号 出 现 以 后 ， 比 如 说 在 
5 天 后 就 可 能 发 生 类 似 的 故障 。 

由 于 大 型 企业 设备 不 但 数量 多 ， 类 型 也 多 ， 每 个 设备 又 有 很 多 数据 采 
集 点 ， 不 同 采集 点 采集 的 数据 类 型 ， 有 的 是 状态 值 ， 有 的 是 连续 数值 ， 计 
量 单位 也 不 同 。 显 然 ， 要 同时 监控 与 分 析 这 么 多 数据 是 比较 困难 的 。 

基本 的 方法 是 对 于 同一 类 采集 点 ， 比 如 温度 ， 在 基准 值 相同 的 情况 下 ， 
通过 平均 值 、 与 基准 值 的 偏差 进行 分 析 ， 这 样 不 管 设备 和 单 台 设备 的 采集 
点 数量 ， 都 可 以 找到 故障 点 。 在 检测 点 类 型 及 基准 值 分 级 不 多 的 情况 下 ， 
这 种 方法 比较 简单 ， 但 如 果 采 集 点 类 型 众多 ， 需 要 分 析 的 数值 就 比较 多 。 

另 一 种 方法 是 为 每 类 设备 设计 一 个 指数 ， 同 时 反映 所 有 采集 点 的 数据 
变化 。 把 同一 台 设 备 上 不 同 采集 点 的 数据 通过 加 权 求 和 计算 为 一 个 指数 ， 
这 个 指数 在 每 次 采样 时 都 保存 在 数据 库 中 。 计 算 指数 的 数据 不 能 直接 用 采 
集 数据 ， 这 个 数据 最 好 是 跟 量 纲 无 关 ， 如 果 用 数值 的 偏差 比例 ， 这 个 比例 
值 就 是 一 个 无 量 纲 的 数值 。 加 权 的 权重 值 根据 检测 点 数据 的 重要 性 确定 。 

把 所 有 设备 的 指数 进行 统计 ， 取 它 的 平均 值 ， 平 时 监测 所 有 设备 的 平 
均 的 指数 值 ， 观 察 平均 值 的 变化 和 排名 ,发 现 有 异常 ， 再 进入 不 同 设 备 和 
采集 点 进行 详细 分 析 。 

发 现 检测 点 的 问题 后 ， 查 看 检测 点 的 历史 数据 ， 历 史 数 据 会 反映 一 种 
上 升 或 下 降 的 趋势 ， 结 合 实际 故障 或 检修 结果 ， 就 可 以 对 故障 进行 分 类 ， 
找 出 故障 发 生 的 规律 。 


6. 6.2 从 检测 大 数据 中 发 现 质量 问题 


制造 企业 在 生产 过 程 中 自动 检测 装置 会 产生 大 量 检测 数据 ， 大 型 工业 
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企业 分 为 子 公 司 、 车 间 、 机 人 台 ， 不 同 子 公 司 或 车 间 生产 不 同 产品 ， 不 同 产 
品 或 同 个 产品 的 不 同 生产 过 程 有 不 同 的 检测 要 求 ， 产 生计 量 单位 和 数量 级 
不 同 的 检测 数据 。 

检测 大 数据 分 析 的 目的 是 从 这 些 检测 数据 中 找到 异常 情况 ， 找 到 异常 
的 检查 点 ， 追 踪 到 子 公 司 、 车 间 、 机 人 台 ， 或 班组 、 员 工 ， 或 原材料 供应 商 。 

质量 数据 的 异常 可 用 标准 差 来 衡量 ， 但 如 果 检 测 数据 的 量 纲 不 同 ， 应 
该 用 变异 系数 。 考 虑 到 多 个 产品 、 多 个 检测 点 的 实际 情况 ， 质 量 大 数据 分 
析 要 用 变异 系数 分 析 。 

具体 流程 是 : 通过 鼠标 交互 ， 按 任意 维度 对 图 形 化 的 检测 数据 的 变异 
系数 进行 分 析 ， 发 现 质量 问题 《变异 系数 值 太 大 ) ， 再 通过 逐 级 钻 取 对 问 
题 进 行 分 析 ， 发 现 问题 所 在 《比如 与 设备 、 员 工 还 是 原材料 供应 商 有 关 ) 。 

为 保证 不 但 满足 目前 需求 ， 而 且 满足 未 来 需求 ， 因 此 不 仅 考虑 当前 关 
注 的 、 敏 感 的 指标 ， 而 是 对 所 有 检测 数据 均 要 可 以 进行 分 析 。 

每 个 检测 指标 提供 样本 个 数 、 平 均值 、 最 大 值 、 最 小 值 、 标 准 差 、 变 
异 系数 等 统计 指标 。 根 据 不 同 的 分 析 条 件 ， 统 计 指 标 有 不 同 的 值 。 

提供 基于 日 期 时间 、 生 产 机 台 、 生产 人 员 、 原材料 供应 商 维度 的 查询 ， 
条 件 可 以 任意 组 合 。 提 供 数据 比较 ， 比 如 不 同 生 产 机 台 、 不 同 生 产 人 员 、 
不 同 原材料 供应 商 同 维度 比较 ; 不 同时 间 同 比 、 环 比比 较 。 

可 以 进行 数据 钻 取 ， 比 如 日 期 维度 可 以 从 年 度 变异 系数 ， 到 某 月 、 某 
日 的 变异 系数 ， 生 产 机 台 维度 可 以 从 车 间 变 异 系数 ， 到 某 区 域 ， 到 某 机 台 
变异 系数 。 

下 面 介绍 两 个 典型 使 用 场景 ， 一 个 是 全 面 质量 检查 ， 另 一 个 是 日 常 质 
量 数 据 检测 。 

全 面 质量 检查 分 别 按 不 同 维度 查看 变异 系数 数据 ， 掌 握 合理 的 变异 系 
数值 ， 作 为 质量 控制 的 目标 。 分 析 的 目的 是 在 不 同 维度 找到 偏 高 或 偏 低 的 
数值 ， 比 如 在 生产 机 台 维度 ， 发 现 车 间 1 的 值 偏 高 ， 点 击 车 间 钻 取 到 区 域 
比较 , 发 现 区 域 B 值 偏 高 , 再 钻 取 区 域 B 到 生产 机 台 比 较 , 发 现 A 机 台 偏 高 。 
将 生产 机 台 维 度 锁定 为 A 机 台 ， 进 入 日 期 维度 ， 查 看 A 机 人 台 的 历史 数据 ， 
从 年 到 月 ， 再 到 日 ， 可 能 发 现 A 机 台 在 10 天 前 数据 开始 偏离 正常 值 。 


根据 以 上 分 析 结果 ， 可 以 现场 安排 检查 A 机 台 ， 是 否 出 现 故 障 。 

日 常数 据 监测 可 以 查看 昨天 变异 系数 的 同比 、 环 比值 ， 如 同比 、 环 比 
接近 0， 证 明 质 量 稳定 。 如 果 发 现 环 比值 比较 大 ， 表 明 上 昨天 质量 出 现 问题 ， 
需要 找到 原因 。 

查看 不 同 维度 的 环比 值 ， 找 到 质量 问题 原因 。 比 如 在 原材料 供应 商 维 
度 ， 发 现 A 公司 供 货 的 产品 变异 系数 高 于 其 他 供应 商 。 在 原材料 供应 维度 
锁定 A 公司 ,进入 日 期 维度 , 查看 利用 A 公司 原材料 生产 产品 的 历史 数据 ， 
可 能 最 后 发 现 该 公司 原材料 昨天 刚 投入 使 用 。 

安排 仓库 和 采购 部 门 对 A 公司 原材料 质量 进行 检查 ， 可 能 因此 及 时 发 
现 一 个 不 合格 供应 商 或 一 批 不 合格 原材料 ， 避 免 继 续 生 产 导致 的 更 大 损失 。 
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7.1 政府 房产 数据 分 析 


房地产 在 中 国 经 济 中 占有 非常 重要 的 地 位 ， 国 家 的 很 多 宏观 财政 金融 
决策 都 与 房地产 的 投资 密切 相关 。 地 方 经 济 同样 受 房地产 投资 和 销售 的 影 
响 巨 大 ， 地 方 政府 的 经 济 决策 都 依赖 对 房地产 数据 的 掌握 。 各 地 住房 保障 
和 房产 管理 局 拥有 房地产 交易 的 详细 数据 ， 可 以 据 此 准确 了 解 城市 房屋 
的 存量 规模 和 交易 情况 ， 无 论 是 政府 政策 制定 、 人 大 的 议案 提案 、 局 领 
导 的 日 常 工 作 、 市 民 的 购房 售 房 决策 ， 都 希望 能 够 方便 、 直 观 地 了 解 这 
些 数据 。 

该 案例 从 三 个 主题 分 析 数 据 , 分 别 为 : 监控 中 心 、 预 售 分 析 和 成 交 分 析 。 


7.1.1 监控 中 心 


监控 中 心 提 供 对 最 新 数据 和 主要 数据 指标 的 监控 和 分 析 。 

监控 中 心 只 与 时 间 维 度 有 关 ， 与 其 他 维度 无 关 ， 可 以 查看 任意 日 期 的 
一 些 综合 指标 。 监 控 中 心 从 概要 和 时 间 两 个 维度 分 析 各 个 指标 ， 相 应 分 为 
概要 和 时 间 维 度 两 个 标签 页 。 

指标 包括 基本 指标 和 计算 指标 。 基 本 指标 有 平均 预 售 基价 (元 /m*〉、 
预 售 总 建筑 面积 (m' ) 、 销 售 面积 (m*) 、 销 售 套数 。 

计算 指标 有 : 

(1) 年 初 至 今 预 售 总 建筑 面积 (m*) : 本 年 1 月 1 号 到 所 选 日 期 的 
累计 预 售 面积 。 

(2) 年 初 至 今 销 售 面积 (m' ) : 本 年 1 月 1 号 到 所 选 日 期 的 累计 销 
售 面积 。 


(3) 年 初 至 今 销 售 套数 : 本 年 1 月 1 号 到 所 选 日 期 的 累计 销售 套数 。 

(4) 项 目 预 售 基价 TOP10: 预 售 基价 最 高 的 10 个 项 目 。 

(5) 项 目 预 售 总 建筑 面积 TOP10: 预 售 总 建筑 面积 最 大 的 10 个 项 目 。 

(6) 项 目 销售 面积 TOP10: 销售 面积 最 大 的 10 个 项 目 。 

(7) 项 目 销售 面积 TOP10 份额 : 销售 面积 最 大 的 10 个 项 目的 百分比 。 

(8) 项 目 销售 套数 TOP10: 销售 套数 最 多 的 10 个 项 目 。 

(9) 项 目 销售 套数 TOP10 份额 :销售 套数 最 多 的 10 个 项 目的 百分比 。 

概要 标签 页 主要 分 析 的 是 各 个 指标 的 合计 数据 以 及 相关 指标 的 排名 情 
况 ， 用 于 平时 监控 预 售 数据 和 成 交 数据 。 概 要 页 面 分 析 的 相关 指标 有 平均 
预 售 基价 、 预 售 总 建筑 面积 、 销 售 面积 、 年 初 至 今 预 售 总 建筑 面积 、 年 初 
至 今 销 售 面积 、 销 售 套数 、 年 初 至 今 销售 套数 ， 以 上 指标 使 用 仪表 盘 表 示 ， 
如 图 7-1 所 示 ， 指 针 位 置 为 本 期 销售 面积 值 ， 红 色 与 绿色 交界 的 位 置 为 销 
售 面积 的 上 期 值 。 
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图 7-1 典型 仪表 盘 


概要 中 还 统计 了 项 目 预 售 基 价 TOP10 排名 ， 项 目 预 售 总 建筑 面积 
TOP10 排名 ， 项 目 销售 面积 TOP10 排名 以 及 TOP10 的 份额 ， 项 目 销售 套 
数 TOP10 排名 以 及 TOP10 的 份额 ， 通 过 条 形 图 分 析 销 售 套数 最 高 的 前 10 
个 项 目 ， 通 过 饼 图 分 析 销 售 套数 最 高 的 前 10 个 项 目的 占 比 情况 。 

时 间 维 度 标 签 页 可 以 查看 各 个 年 份 、 月 份 及 每 天 的 指标 的 走势 情况 。 
通过 折线 图 分 析 平 均 预 售 基 价 ， 预 售 总 建筑 面积 、 销 售 面积 ， 年 初 至 今 预 
售 总 建筑 面积 、 年 初 至 今 销 售 面积 ， 销 售 套数 、 年 初 至 今 销 售 套数 的 走势 
情况 。 将 预 售 总 建筑 面积 和 销售 面积 放 在 一 张 图 形 上 面 ， 既 可 以 分 析 预 售 
总 建筑 面积 和 销售 面积 的 走势 情况 ， 也 体现 了 预 售 面积 与 已 售 面积 的 对 比 
关系 。 


空 关 站 | 二、 由 


司 


1207 





“是 几 哨 注 - 


音 灿 着 洲 , 济 填 泻 将 证 他 满 瑟 省 


他; 


208 | 


7. 1.2 预 售 数据 分 析 


预 售 数据 分 析 可 以 从 预 售 时 间 、 项 目 、 用 途 三 个 维度 进行 分 析 ， 并 相 
应 地 分 为 时 间 、 项 目 、 用 途 三 个 维度 标签 页 和 一 个 明细 标签 页 。 

预 售 时 间 维 度 按 年 、 月 、 日 三 个 级 别 的 层次 分 析 。 项 目 维度 按 板 块 、 
项 目 名称 两 个 级 别 的 层次 分 析 ， 一 线 城市 需要 加 一 个 级 别 一 一 区 。 物 业 类 
型 维度 只 有 一 个 级 别 ， 分 为 住宅 或 商业 两 项 。 

预 售 分 析 的 指标 分 为 基础 指标 和 计算 指标 。 基 础 指标 为 : 预 售 基价 
(元 /m*) 、 预 售 总 建筑 面积 (m*) 、 销 售 面积 (m*) 、 项 目 个 数 、 预 售 
证 号 个 数 。 

计算 指标 为 : 

(1) 同比 增长 率 ， 指标 对 于 上 一 年 数据 的 增长 率 。 

(2) 环比 增长 率 ， 指标 对 于 本 年 上 一 个 月 数据 的 增长 率 。 

(3) TOP10: 一 个 维度 下 最 后 一 个 层次 的 某 个 指标 的 前 10 名 。 

(4) BOTTOM10: 一 个 维度 下 最 后 一 个 层次 的 某 个 指标 的 后 10 名 。 

(5) TOP10 份额 : 对 于 某 个 指标 TOP10 及 其 他 的 占 比 情况 。 

(6) 年 初 至 今 ， 本 年 1 月 1 号 到 所 选 日 期 的 累计 值 。 

(7) 迄今 为 止 : 数据 产生 日 到 所 选 日 期 的 累计 值 。 

时 间 维 度 标签 页 可 以 查看 任意 板块 、 任 意 项 目 ， 各 个 年 份 、 月 份 及 每 
天 的 各 个 指标 的 走势 情况 ， 通 过 折线 图 可 以 分 析 平 均 预 售 基价 、 预 售 总 建 
筑 面积 、 销 售 面积 、 项 目 个 数 、 预 售 证 号 个 数 等 指标 的 走势 情况 。 将 预 售 
总 建筑 面积 和 销售 面积 放 在 一 张 图 形 上 ， 既 可 以 分 析 预 售 总 建筑 面积 和 销 
售 面 积 的 走势 情况 也 体现 了 预 售 面积 与 已 售 面积 的 对 比 关 系 。 

项 目 维度 标签 页 可 以 查询 任意 时 间 的 各 个 板块 、 各 个 项 目的 相关 指标 
的 对 比 情况 ， 通 过 直方 图 分 析 平 均 预 售 基价 、 预 售 总 建筑 面积 、 销 售 面积 、 
项 目 个 数 、 预 售 证 号 个 数 等 指标 的 对 比 情况 。 将 迄今 为 止 预 售 总 建筑 面积 
和 迄今 为 止 总 销售 面积 放 在 一 张 图 形 上 对 比 ， 更 加 明显 地 体现 预 售 总 建筑 
面积 和 总 销售 面积 的 对 比 关 系 。 

通过 钻 取 功 能 ， 可 以 查询 任意 板块 下 所 有 项 目的 对 比 情况 ， 比 如 钻 取 


主 城区 ， 可 以 查看 主 城区 下 各 个 项 目 迄 今 为 止 总 预 售 建筑 面积 和 迄今 为 止 
总 销售 面积 的 对 比 情况 。 

对 于 每 个 典型 指标 ， 可 以 查看 该 指标 的 更 加 详细 的 分 析 数 据 。 以 项 目 
维度 的 平均 预 售 基价 指标 为 例 ， 可 以 展示 平均 预 售 基价 的 本 期 值 、 同 期 值 、 
同比 增长 率 、 环 比 增长 率 、 平 均 预 售 基价 最 高 的 前 10 个 项 目 、 前 10 个 项 
目的 时 间 走 势 、 平 均 预 售 基价 同比 增长 最 快 的 前 10 个 项 目 及 同比 增长 最 
慢 的 前 10 个 项 目 、 平 均 预 售 基价 环比 增长 最 快 的 前 10 个 项 目 及 环比 增长 
最 慢 的 前 10 个 项 目 。 

明细 标签 页 以 表格 形式 展示 了 有 关 预 售 信息 的 明细 数据 ,包括 预 售 证 号 、 
项 目 名 称 、 开 发 企业 、 所 在 板块 、 房 屋 坐落 地 址 、 预 售 时 间 、 预 计 竣 工时 间 、 
房屋 用 途 性 质 、 预 售 总 建筑 面积 、 车 库 建 筑 面积 、 预 售 基价 的 详细 信息 。 


7.1.3 成 交 数 据 分 析 


成 交 分 析 主 要 从 时 间 、 项 目 、 面积 、 户型、 物业 类 型 五 个 维度 进行 分 析 ， 
分 别 对 应 一 个 标签 页 ， 另 有 一 个 明细 标签 页 。 

时 间 维 度 按 年 、 月 、 日 三 个 级 别 的 层次 分 析 。 项 目 维度 按 板块 、 项 目 
名 称 两 个 级 别 的 层次 分 析 ， 一 线 城市 需要 加 一 个 级 别 一 一 区 。 面 积 和 户型 
只 有 一 个 级 别 。 物 业 类 型 维度 只 有 一 个 级 别 ， 分 为 住宅 或 商业 两 项 。 

成 交 分 析 的 指标 分 为 基础 指标 和 计算 指标 。 基 础 指标 为 : 销售 套数 、 
销售 面积 。 

计算 指标 为 : 

(1) 同比 增长 率 : 指标 对 于 上 一 年 数据 的 增长 率 。 

(2) 环比 增长 率 指标 对 于 本 年 上 一 个 月 数据 的 增长 率 。 

(3) TOP10: 一 个 维度 下 最 后 一 个 层次 的 某 个 指标 的 前 10 名 。 

(4) BOTTOM10: 一 个 维度 下 最 后 一 个 层次 的 某 个 指标 的 后 10 名 。 

(5) TOP10 份额 : 对 于 某 个 指标 TOP10 及 其 他 的 占 比 情况 。 

时 间 维 度 标签 页 可 以 查看 任意 板块 、 任 意 项 目 名 称 、 任 意 面积 分 类 、 
任意 户型 的 各 个 年 份 、 月 份 及 每 天 的 指标 的 走势 情况 。 通 过 折线 图 分 析 销 
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售 套数 、 销 售 面积 的 走势 情况 ， 如 图 7-2 所 示 。 
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7-2 年 度 的 时 间 走 势 (X 轴 为 月 份 ) 


通过 钻 取 功能 , 可 以 查看 一 个 月 每 天 的 销售 套数 的 走势 , 如 图 7-3 所 示 ， 
钻 取 8 月 份 ， 可 以 查看 8 月 份 每 天 的 销售 套数 。 
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图 7-3 钻 取 到 月 份 的 时 间 走 势 (X 轴 为 日 期 ) 


项 目 维 度 标签 页 可 以 查询 任意 时 间 、 任 意 面积 分 类 、 任 意 户 型 的 各 个 
板块 各 个 项 目的 相关 指标 的 对 比 情况 ， 通 过 直方 图 和 饼 图 的 形式 展示 销售 
套数 、 销 售 面积 的 对 比 情 况 。 通 过 饼 图 , 可 以 查看 各 个 板块 关于 销售 套数 ( 销 
售 面积 ) 的 占 比 情况 。 点 击 钻 取 主 城区 ， 可 以 查看 主 城区 下 各 个 项 目的 销 
售 套数 (销售 面积 ) 的 对 比 情 况 。 通 过 饼 图 ， 可 以 查看 各 个 板块 关于 销售 
套数 销售 面积 ) 的 占 比 情况 。 

对 于 每 个 典型 指标 ， 都 可 以 查看 该 指标 的 更 加 详细 的 分 析 数 据 。 以 项 
目 维度 的 销售 套数 为 例 展 示 销 售 套数 的 本 期 值 、 同 期 值 、 同 比 增长 率 、 环 
比 增长 率 、 销 售 套数 最 高 的 前 10 个 项 目 及 前 10 个 项 目的 占 比 ， 前 10 个 
项 目的 时 间 走 势 、 销 售 套数 同比 增长 最 快 的 前 10 个 项 目 及 同比 增长 最 慢 
的 前 10 个 项 目 、 销 售 套数 环比 增长 最 快 的 前 10 个 项 目 及 环比 增长 最 慢 的 


前 10 个 项 目 。 

销售 套数 最 高 的 前 10 个 项 目 统计 的 是 所 有 板块 中 销售 套数 最 高 的 前 
10 个 项 目 以 及 这 10 个 项 目的 上 期 销售 套数 、 销 售 套数 的 环比 增长 率 以 及 销 
售 面积 的 情况 ， 以 多 横 条 图 的 形式 展示 ， 使 对 比 更 加 明显 ， 如 图 7-4 所 示 。 





项 目 名 称 销售 套数 上 期 销售 套数 环比 增长 率 〈%) 销售 面积 (m2) 

















吴 中 豪 景 华 庭 
































7-4 销售 套数 最 高 的 前 10 个 项 目 


面积 分 类 维度 标签 页 可 以 查询 任意 时 间 、 任 意 板块 、 任 意 项 目 、 任 意 
户型 的 各 个 面积 分 类 的 相关 指标 的 比较 。 通 过 直方 图 和 饼 图 的 形式 分 析 销 
售 套数 、 销 售 面积 的 比较 ， 可 以 展示 各 个 面积 分 类 销售 套数 、 销 售 面积 的 
对 比 关 系 。 通 过 人 饼 图 ， 查 看 各 个 面积 分 类 的 销售 面积 的 占 比 情况 。 

户型 维度 标签 页 可 以 查看 任意 时 间 、 任 意 板块 、 任 意 项 目 、 任 意 面积 
分 类 的 各 个 户型 的 相关 指标 的 分 析 。 通 过 直方 图 和 饼 图 的 形式 分 析 销售 套 
数 、 销 售 面积 的 比较 。 通 过 饼 图 ， 查 看 各 个 户型 的 销售 套数 的 占 比 情况 。 

明细 标签 页 展示 了 有 关 成 交 记录 的 明细 数据 ， 包 括 项 目 名 称 、 楼 盘 地 
址 、 所 在 板块 、 面 积 、 户 型 、 物 业 类 型 、 销 售 套数 、 销 售 面积 的 详细 信息 。 


7.2 ”医院 管理 决策 支持 系统 


医院 决策 支持 系统 分 为 两 种 类 型 : 一 是 医院 管理 的 决策 支持 ， 二 是 临 
床 决策 支持 。 
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本 方案 主要 用 于 医院 管理 ， 数 据 来 源 于 医院 的 多 个 信息 系统 。 医 院 管 
理 决策 支持 系统 以 提供 综合 查询 的 监控 中 心 作为 进入 其 他 分 析 主 题 的 入 
口 ， 起 一 个 门户 作用 ， 显 示 最 近 一 天 的 主要 指标 及 随时 间 的 变化 ， 如 果 对 
某 个 指标 感 兴趣 ， 可 以 点 击 链接 进入 相应 的 分 析 主 题 ， 从 更 多 维度 分 析 ， 
并 看 到 其 他 相关 指标 。 

该 方案 从 九 个 主题 分 析 有 关 医 院 管理 的 数据 ， 分 别 为 医药 收费 数据 分 
析 、 门诊 数据 分 析 、 住院 数据 分 析 、 用 药 数据 分 析 、 医疗 项 目 收入 数据 分 析 、 
大 型 诊断 检查 数据 分 析 、 手 术 数 据 分 析 、 体 检 数 据 分 析 和 物资 出 入 库 数据 
分 析 。 


7.2.1 监控 中 心 


监控 中 心 提供 对 最 新 数据 和 主要 数据 的 监控 和 分 析 。 

监控 中 心 只 与 时 间 维 度 有 关 ， 与 其 他 维度 无 关 ， 查 看 任意 日 期 的 一 些 
综合 指标 。 监 控 中 心 从 概要 和 时 间 两 个 维度 标签 页 分 析 各 个 指标 。 

指标 有 基础 指标 和 计算 指标 。 监 控 中 心 的 基础 指标 为 门诊 收费 、 住 院 
收费 、 门 诊 量 、 门 诊 医 疗 收入 、 门 诊 药品 收入 、 住 院 医疗 收入 、 住 院 药品 
收入 。 

监控 中 心 的 计算 指标 有 科室 门诊 收费 TOP10、 科 室 住院 收费 TOP10、 
医生 门诊 量 TOP10、 医 生 门 诊 量 TOP10 份额 、 主 要 诊断 门诊 量 TOP10、 
主要 诊断 门诊 量 TOP10 份额 、 科 室 门 诊 医 疗 收入 TOP10、 科 室 门 诊 药品 
收入 TOP10、 科 室 住 院 医疗 收入 TOP10、 科 室 住院 药品 收入 TOP10。 其 
中 科室 门诊 收费 TOP10 为 门诊 收费 最 高 的 前 10 个 科室 ， 科 室 住 院 收费 
TOP10 为 住院 收费 最 高 的 前 10 个 科室 ， 医 生 门诊 量 TOP10 为 门诊 量 最 多 
的 前 10 位 医生 ， 医 生 门 诊 量 TOP10 份额 为 门诊 量 最 多 的 前 10 位 医生 占 
所 有 医生 总 门诊 量 的 占 比 情况 ， 主 要 诊断 门诊 量 TOP10 为 门诊 量 最 高 的 前 
10 种 主要 诊断 ， 主 要 诊断 门诊 量 TOP10 份额 为 门诊 量 最 高 的 前 10 种 主要 
诊断 占 所 有 主要 诊断 的 总 门诊 量 的 占 比 情况 ， 科 室 门 诊 医 疗 收入 TOP10 为 
门诊 医疗 收入 最 高 的 前 10 个 科室 ， 科 室 门 诊 药品 收入 TOP10 为 门诊 药品 收 


入 最 高 的 前 10 个 科室 ， 科 室 住院 医疗 收入 TOP10 为 住院 医疗 收入 最 高 的 前 
10 个 科室 ， 科 室 住院 药品 收入 TOP10 为 住院 药品 收入 最 高 的 前 10 个 科室 。 

概要 标签 页 主要 分 析 的 是 各 个 指标 的 合计 数据 以 及 相关 指标 的 排名 情 
况 ， 用 于 实时 监控 医院 有 关 收 费 以 及 门诊 量 的 数据 。 概 要 页 面 分 析 的 相关 
指标 有 : 门诊 收费 、 住 院 收费 、 门 诊 量 、 门 诊 医 疗 收入 、 门 诊 药 品 收入 、 
住院 医疗 收入 、 住 院 药品 收入 ， 以 上 指标 使 用 仪表 盘 表 示 。 如 图 7-5 所 示 ， 
指针 位 置 为 门诊 收费 的 本 期 值 , 红色 和 绿色 交界 的 位 置 为 门诊 收费 的 上 期 值 。 


0 1 200 


图 7-5 门诊 收费 的 仪表 盘 


概要 中 还 统计 了 相关 指标 的 排名 情况 ， 有 科室 门诊 收费 TOP10、 科 
室 住院 收费 TOP10、 医 生 门 诊 量 TOP10 以 及 份额 情况 、 主 要 诊断 门诊 量 
TOP10 以 及 份额 、 科 室 门诊 医疗 收入 TOP10、 科 室 门诊 药品 收入 TOP10、 
科室 住院 医疗 收入 TOP10、 科 室 住院 药品 收入 TOP10。 一 般 用 横 条 图 显示 
各 种 TOP10 排名 ， 通 过 饼 图 显示 TOP10 份额 。 

时 间 维 度 标 签 页 可 以 查看 各 个 年 份 ， 各 个 月 份 及 每 天 的 指标 的 走势 情 
况 。 通 过 折线 图 分 析 门 诊 收费 、 住 院 收费 、 门 诊 量 、 门 诊 医 疗 收 入 、 门 诊 
药品 收入 、 住 院 医疗 收入 、 住 院 药品 收入 的 走势 情况 。 比 如 ， 将 门诊 收费 
和 住院 收费 放 在 同一 张 折线 图 上 ， 既 可 以 分 析 门 诊 收费 和 住院 收费 的 走势 
情况 也 体现 了 门诊 收费 和 住院 收费 的 对 比 关系 。 


7.2.2 医药 收费 数据 分 析 


医药 收费 数据 分 析 从 时 间 、 医 师 、 医 药 、 门 诊 住 院 、 地 区 、 性 别 、 年 
龄 以 及 病人 属性 8 个 维度 分 析 关 于 收费 的 情况 。 
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医药 数据 分 析 从 时 间 、 医 师 、 医 药 、 门 诊 住院 、 地 区 、 性 别 、 年 龄 段 、 
病人 属性 及 明细 9 个 标签 页 面 以 及 每 个 典型 指标 的 二 级 页 面 分 析 收 费 指标 。 
对 于 多 层次 的 维度 标签 页 ， 可 以 通过 钻 取 功 能 查看 下 一 层 维度 页 面 的 指标 。 

医药 收费 数据 分 析 从 时 间 、 医 师 、 医 药 、 门 诊 住院 、 地区、 性 别 、 年 龄 段 、 
病人 属性 8 个 维度 分 析 各 个 指标 。 时 间 可 以 是 就 诊 时 间 、 入 院 时 间 、 出 院 
时 间 、 手 术 时 间 ， 可 以 任意 选择 ， 时 间 维 度 的 层次 为 年 、 月 、 日 ， 医师 维 
度 的 层次 为 科室 、 医 生 ; 门诊 住院 维度 值 为 门诊 或 者 住院 ， 地 区 维度 为 病 
人 所 属地 区 为 市 区 下 面 的 各 个 区 ， 性 别 维度 值 为 男 或 者 女 ， 年 龄 段 维度 为 各 
个 年 龄 段 ， 一 般 分 为 0 一 6 岁 、7 一 17 岁 、18 一 40 岁 、41 一 65 岁 、66 岁 
以 上 ; 病人 属性 维度 一 般 分 为 现金 儿童 医保 、 居 民 医 保 、 公 务 员 医 保 、 农 保 。 

医药 收费 数据 分 析 指 标 分 为 基础 指标 和 计算 指标 ， 基 础 指标 为 收费 ， 
计算 指标 为 同比 增长 率 、 环 比 增长 率 、 指 标 值 的 排名 前 10 名 、 指 标 值 的 
排名 后 10 名 、 指 标 值 的 份额 。 其 中 指标 同比 增长 率 为 本 期 指标 值 与 上 一 
年 同期 的 数据 相 比 较 的 增长 率 ， 环 比 增长 率 为 本 期 指标 值 对 于 本 年 上 一 期 
的 数据 相 比 较 的 增长 率 ， 指 标 值 的 排名 前 10 名 为 一 个 维度 下 最 后 一 个 层 
次 的 某 个 指标 的 前 10 名 ， 指 标 值 的 排名 后 10 名 为 一 个 维度 下 最 后 一 个 层 
次 的 某 个 指标 的 后 10 名 ,指标 份 额 是 对 于 某 个 指标 值 占 该 指标 合计 值 的 
占 比 。 

时 间 维 度 可 以 查询 任意 科室 、 任 意 医 生 、 任 意 医 药 、 任 意 门诊 住院 、 
任意 地 区 、 男 或 者 女 、 任 意 年 龄 段 、 任 意 病人 属性 的 各 个 年 份 、 各 个 月 份 
及 每 天 的 关于 收费 的 走势 情况 ， 通 过 折线 图 分 析 收 费 的 走势 情况 。 通 过 钻 
取 功 能 ， 可 以 查看 一 个 月 每 天 的 收费 走势 。 

医师 维度 可 以 查询 任意 时 间 、 任 意 医药 、 任 意 门 诊 住院 、 任 意 地 区 、 
男 或 者 女 、 任 意 年 龄 段 、 任 意 病 人 属性 的 各 个 科室 或 者 各 个 医生 关于 收费 
的 对 比 情况 。 比 如 ， 通 过 直方 图 ， 将 各 个 科室 的 收费 放 在 一 张 图 形 上 ， 更 
加 明显 地 对 比 各 个 科室 的 收费 情况 。 通 过 钻 取 功能 ， 可 以 查询 各 个 科室 下 
每 位 医生 的 收费 情况 。 

医药 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医 师 、 任 意 门诊 住院 、 任 意 
地 区 、 男 或 者 女 、 任 意 年 龄 段 、 任 意 病 人 属性 的 有 关 医 疗 和 药品 的 收费 情况 。 


比如 ， 通 过 直方 图 展示 医疗 和 药品 关于 收费 的 对 比 情 况 ， 通 过 人 饼 图 ， 可 以 
查看 医疗 和 药品 关于 收费 的 占 比 情况 。 

门诊 住院 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医 师 、 任 意 医 药 、 任 意 
地 区 、 男 或 者 女 、 任 意 年 龄 段 、 任 意 病人 属性 的 门诊 、 住 院 关 于 收费 的 对 
比 情况 ， 比 如 通过 直方 图 的 形式 分 析 门 诊 和 住院 关于 收费 的 对 比 情况 ， 通 
过 饼 图 的 形式 展示 门诊 和 住院 关于 收费 的 占 比 情况 。 

地 区 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医 师 、 任 意 医药 、 任 意 门诊 
住院 、 男 或 者 女 、 任 意 年 龄 段 、 任 意 病人 属性 的 各 个 地 区 的 关于 收费 的 对 
比 情况 。 比 如 ， 通 过 直方 图 的 形式 展示 各 个 地 区 〈 以 南通 的 各 个 地 区 为 例 ) 
的 收费 情况 ， 通 过 饼 图 可 以 查看 各 个 地 区 关于 收费 的 占 比 情况 。 

性 别 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医师 、 任 意 医药 、 任 意 门 诊 
住院 、 任 意 地 区 、 任 意 年 龄 段 、 任 意 病人 属性 的 男 、 女 关于 收费 的 对 比 情 
况 。 比 如 ， 通 过 直方 图 展示 男 、 女 关于 收费 的 对 比 情况 ， 通 过 人 饼 图 展示 男 、 
女 关 于 收费 的 占 比 情况 。 

年 龄 段 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医师 、 任 意 医 药 、 任 意 门 
诊 住院 、 任 意 地 区 、 男 或 者 女 、 任 意 病人 属性 的 各 个 年 龄 段 的 关于 收费 的 
对 比 情况 。 比 如 ， 通 过 直方 图 ， 展 示 各 个 年 龄 段 的 关于 收费 的 对 比 情况 ， 
通过 饼 图 可 以 查看 各 个 年 龄 段 关 于 收费 的 占 比 情况 。 

病人 属性 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医师 、 任 意 医药 、 任 意 
门诊 住院 、 任 意 地 区 、 男 或 者 女 、 任 意 年 龄 段 的 各 个 病人 属性 的 有 关 收 费 
的 对 比 情况 。 比 如 ， 通 过 直方 图 ， 展 示 了 各 个 病人 属性 的 关于 收费 的 对 比 
情况 ， 通 过 饼 图 展示 各 个 病人 属性 的 关于 收费 的 占 比 情况 。 

对 于 每 个 典型 指标 ， 还 可 以 查看 该 指标 更 加 详细 的 分 析 数 据 。 以 医师 
维度 的 收费 指标 为 例 ， 可 以 展示 收费 的 本 期 值 、 同 期 值 、 同 比 增长 率 、 上 
期 值 、 环 比 增长 率 、 收 费 最 高 的 前 10 位 医生 以 及 前 10 位 医生 的 收费 的 占 比 、 
前 10 位 医生 的 收费 的 时 间 走 势 ， 收 费 同比 增长 最 快 的 前 10 位 医生 及 同比 
增长 最 慢 的 前 10 位 医生 、 收 费 环比 增长 最 快 的 前 10 位 医生 及 环比 增长 最 
慢 的 前 10 位 医生 。 

明细 页 面 展示 了 有 关 医 药 收费 的 明细 数据 ， 包 括 日 期 、 科 室 、 医 生 、 
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医药 类 型 、 门 诊 住 院 、 地 区 、 年 龄 、 病 人 属性 、 收 费 的 详细 信息 。 


7.2.3 门诊 数据 分 析 


门诊 数据 分 析 从 时 间 、 医 师 、 主 要 诊断 3 个 维度 分 析 门 诊 人 次 、 急 诊 
人 次 、 留 观 人 次 、 医 疗 收入 、 医 药 收入 、 药 占 比 等 指标 的 走势 及 对 比 情况 。 

门诊 数据 分 析 从 时 间 、 医 师 、 主 要 诊断 3 个 维度 分 析 指 标 ， 分 为 时 间 、 
医师 、 主 要 诊断 、 明 细 4 个 标签 页 面 ， 以 及 每 个 典型 指标 的 二 级 页 面 分 析 
各 个 指标 。 对 于 多 层次 的 维度 标签 页 ， 可 以 通过 钻 取 功能 查看 下 一 层 维 度 
页 面 的 指标 。 

时 间 维度 层次 为 年 、 月 、 日 ， 医 师 维度 层次 为 科室 、 医 生 ， 主 要 诊断 
维度 的 层次 为 科室 、 主 要 诊断 。 

门诊 数据 分 析 基 本 指标 有 门诊 人 次 、 急 诊 人 次 、 留 观 人 次 、 医 疗 收入 、 


计算 指标 有 人 均 医 疗 收费 、 每 人 次 药品 收费 、 药 占 比 、 医 均 门诊 人 次 、 
医 均 医 药 收 入 、 指 标的 同比 增长 率 、 指 标的 环比 增长 率 、 指 标 排名 前 10 名 、 
指标 排名 后 10 名 、 指 标 份额 。 其 中 人 均 医 疗 收费 等 于 总 医疗 收入 除 以 总 
人 数 ， 每 人 次 药品 收费 等 于 总 药品 收入 除 以 总 人 次 ， 药 品 占 比 等 于 药品 收 
入 与 医疗 收入 和 药品 收入 之 和 的 比率 ， 医 均 门 诊 人 次 为 总 的 门诊 人 次 除 以 
医生 人 数 ， 医 均 医 药 收入 为 药品 收入 除 以 医生 总 人 数 ， 其 中 指标 同比 增长 
率 为 本 期 指标 值 与 上 一 年 同期 的 数据 相 比 较 的 增长 率 ， 环 比 增长 率 为 本 期 
指标 值 对 于 本 年 上 一 期 的 数据 相 比 较 的 增长 率 ， 指 标 值 的 排名 前 10 名 为 
一 个 维度 下 最 后 一 个 层次 的 某 个 指标 的 前 10 名 ， 指 标 值 的 排名 后 10 名 一 
个 维度 下 最 后 一 个 层次 的 某 个 指标 的 后 10 名 ， 指 标 份额 是 对 于 某 个 指标 
值 占 该 指标 合计 值 的 占 比 。 

时 间 维 度 标签 页 可 以 查看 任意 科室 、 任 意 医 生 、 任 意 主要 诊断 的 各 个 
年 份 、 各 个 月 份 以 及 每 天 的 指标 的 走势 情况 。 通 过 折线 图 或 者 时 序 堆积 图 
分 析 门 诊 和 人 次、 急诊 人 次 、 留 观 人 次 、 医 疗 收入 、 药 品 收入 等 指标 的 走势 
情况 。 通 过 时 序 堆 积 图 , 将 医疗 收入 和 药品 收入 放 在 一 张 图 上 面 ( 见 图 7-6)， 


既 可 以 看 出 医疗 收入 和 药品 收入 的 走势 情况 也 体现 了 二 者 的 合计 关系 。 
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图 7-6 用 堆 释 图 按 月 份 显示 的 时 间 维 度数 据 














通过 钻 取 功能 ,可 以 查看 每 个 月 每 天 的 数据 走势 情况 。 如 图 7-7 所 示 ， 
钻 取 5 月 份 可 以 查看 5 月 每 天 医疗 收入 和 药品 收入 的 走势 及 合计 情况 。 
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图 7-7 从 月 份 钻 取 到 日 期 后 的 时 间 维 度数 据 














通过 折线 图 体现 指标 的 走势 情况 ， 将 门诊 人 次 、 急 诊 人 次 、 留 观 人 次 
3 个 指标 放 在 一 张 图 形 上 ， 既 可 以 查看 这 3 个 指标 的 走势 情况 也 体现 了 这 
3 个 指标 的 对 比 情况 。 用 钻 取 功 能 ， 可 以 查看 每 个 月 每 天 的 数据 走势 ， 比 
如 钻 取 5 月 ， 可 以 查看 5 月 每 天 关于 门诊 人 次 、 和 急诊 人 次 、 留 观 人 次 这 3 
个 指标 的 走势 对 比 情况 。 

医师 维度 标签 页 可 以 查询 任意 时 间 、 任 意 主要 诊断 的 各 个 科室 、 每 位 
医生 的 指标 对 比 情况 。 通 过 直方 图 或 者 直方 堆积 图 展示 各 个 指标 的 对 比 情 
况 。 如 图 7-8 所 示 ， 使 用 双 立 直方 堆积 图 ， 既 体现 了 医疗 收入 和 药品 收入 
合计 情况 ， 也 体现 了 药 占 比 的 情况 。 
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7-8 医师 维度 在 科室 级 别 的 数据 比较 


通过 钻 取 功能 ， 可 以 查看 每 个 科室 每 位 医生 各 个 指标 的 对 比 情况 。 如 
图 7-9 所 示 ， 钻 取 内 科 ， 可 以 查看 内 科 每 位 医生 的 医疗 收入 、 药 品 收入 及 
药 占 比 的 对 比 情况 。 
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图 7-9 ”医师 维度 钻 取 到 医生 级 别 的 数据 比较 


主要 诊断 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医师 的 各 个 科室 、 各 个 
主要 诊断 的 指标 对 比 情况 。 通 过 直方 图 或 者 直方 堆积 图 展示 各 个 指标 的 对 
比 情况 。 如 图 7-10 所 示 ， 通 过 直方 图 ， 将 门诊 人 次 、 急 诊 人 次 、 留 观 人 次 
放 在 一 张 图 形 上 ， 更 加 明显 地 体现 了 这 3 个 指标 在 各 个 科室 的 对 比 关系 。 
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7-10 主要 诊断 维度 在 科室 级 别 的 数据 比较 


通过 钻 取 功能 ， 可 以 查看 各 个 科室 每 个 主要 诊断 的 指标 对 比 情况 。 如 
图 7-11 所 示 ， 钻 取 内 科 ， 可 以 查看 内 科 每 种 主要 诊断 的 门诊 量 

















7-11 主要 诊断 维度 钻 取 到 诊断 级 别 的 数据 比较 


对 于 每 个 典型 指标 ， 都 有 一 个 对 应 的 二 级 页 面 ， 可 以 查看 该 指标 更 加 
详细 的 分 析 数 据 。 以 主要 诊断 维度 的 门诊 量 为 例 展示 门诊 量 的 本 期 值 、 同 
期 值 、 同 比 增长 率 、 上 期 值 、 环 比 增长 率 ， 门 诊 量 最 高 的 10 种 病 种 及 前 
10 种 主要 诊断 的 占 比 ， 前 10 钟 主 要 诊断 的 时 间 走 势 ， 门 诊 量 同比 增长 最 
快 的 前 10 种 主要 诊断 及 同比 增长 最 慢 的 前 10 种 主要 诊断 ， 门 诊 量 环比 增 
长 最 快 的 前 10 种 主要 诊断 及 环比 增长 最 慢 的 前 10 种 主要 诊断 。 

明细 页 面 用 类 似 报表 的 表格 形式 展示 了 有 关门 诊 分 析 的 明细 数据 ， 包 
括 日 期 、 科 室 、 医 生 、 主 要 诊断 、 门 诊 量 、 和 急诊 人 次 、 留 观 人 次 、 医 疗 收入 、 
药品 收入 。 数 据 是 被 前 面 的 各 个 维度 联合 过 滤 后 的 一 个 子 集 。 
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7.2.4 住院 数据 分 析 


住院 数据 分 析 从 时 间 、 医 师 、 主 要 诊断 、 出 院 状 态 4 个 维度 分 析 医 疗 
收入 、 药 品 收入 、 药 占 比 等 相关 指标 。 住 院 数据 分 析 的 分 析 方 式 同门 诊 数 
据 分 析 类 似 。 

住院 数据 分 析 从 时 间 、 医 师 、 主 要 诊断 、 出 院 状态 、 明 细 5 个 标签 页 以 
及 典型 指标 的 二 级 页 面 分 析 医 疗 收入 、 药 品 收入 、 占 用 床位 日 等 相关 指标 。 
对 于 多 层次 的 维度 标签 页 ， 可 以 通过 钻 取 功能 查看 下 一 层 维度 页 面 的 指标 。 

指标 分 为 基础 指标 和 计算 指标 ， 其 中 基础 指标 包括 医疗 收入 、 药 品 收 
入 、 床 位 占用 数 、 入 院 人 数 、 出 院 人 数 、 出 院 者 占用 床位 日 ， 计 算 指 标 包 
括 药 占 比 、 出 院 者 平均 住院 日 病床 使 用 率 、 病床 周转 次 数 、 每 床 日 收费 额 、 
每 床 日 收 药品 费 、 平 均 病床 工作 日 。 其 中 药 占 比 为 药品 收入 与 医疗 收入 和 
药品 收入 之 和 的 比率 ， 出 院 者 平均 住院 日 为 出 院 者 占用 总 床 日 数 除 以 出 院 
人 数 ， 病 床 使 用 率 为 实际 占用 的 总 床 日 数 与 实际 开放 的 总 床 日 数 之 比 ， 病 
床 周 转 次 数 为 出 院 人 数 除 以 平均 开放 病床 数 ， 每 床 日 收费 额 为 医疗 收入 和 
药品 收入 之 和 除 以 住院 床 日 ， 每 床 日 收 药品 费用 为 药品 收入 除 以 住院 床 日 ， 
平均 病床 工作 日 为 实际 占用 总 床 日 数 除 以 平均 开放 病床 数 。 

时 间 维 度 标签 页 可 以 查看 任意 科室 、 任 意 医生 、 任 意 主要 诊断 、 任 意 
出 院 状态 的 各 个 年 份 、 各 个 月 份 以 及 每 天 的 相关 指标 的 走势 情况 。 通 过 时 
序 堆积 图 和 折线 图 分 析 医 疗 收入 、 药 品 收入 、 药 占 比 、 占 用 床位 日 、 平 均 
住院 日 、 入 院 人 数 、 出 院 人 数 等 指标 的 走势 情况 。 

医师 维度 标签 页 可 以 查询 任意 时 间 、 任 意 主要 诊断 、 任 意 出 院 状 态 的 
各 个 科室 、 每 位 医生 的 医疗 收入 、 药 品 收入 、 药 占 比 、 占 用 床位 日 、 平 均 
住院 日 、 入 院 人 数 、 出 院 人 数 等 指标 的 对 比 情况 。 通 过 直方 图 或 者 双 Y 直 
方 堆积 图 展示 各 个 指标 的 对 比 情况 。 

主要 诊断 (科室 > 主要 诊断 ) 维度 标签 页 可 以 查询 任意 时 间 、 任意 医师 、 
任意 出 院 状 态 的 各 个 科室 、 每 种 主要 诊断 的 医疗 收入 、 药 品 收入 、 药 占 比 、 
占用 床位 日 、 平 均 住 院 日 、 入 院 人 数 、 出 院 人 数 等 指标 的 对 比 情况 。 通 过 
直方 图 或 者 双 Y 直方 堆积 图 展示 各 个 指标 的 对 比 情况 。 


出 院 状 态 维度 标签 页 可 以 查询 任意 时 间 、 任 意 医师 、 任 意 主要 诊断 的 
各 个 出 院 状 态 的 关于 医疗 收入 、 药 品 收入 、 药 占 比 、 占 用 床位 日 、 平 均 住 
院 日 、 入 院 人 数 、 出 院 人 数 等 指标 的 对 比 情况 。 通 过 直方 图 或 者 双 YY 直方 
堆积 图 展示 各 个 指标 的 对 比 情况 。 

每 个 典型 指标 ， 都 有 一 个 对 应 的 二 级 页 面 ， 可 以 查看 该 指标 更 加 详细 
的 分 析 数 据 。 主 要 分 析 指 标的 本 期 值 、 同 期 值 、 上 期 值 、 同 比 增长 率 、 环 
比 增长 率 以 及 相关 指标 的 排名 情况 。 

明细 页 面 用 类 似 报表 的 表格 形式 展示 了 相关 住院 数据 分 析 的 明细 数 
据 ， 包 括 日 期 、 科 室 、 医 生 、 主 要 诊断 、 出 院 状 态 、 医 疗 收入 、 药 品 收入 、 
入 院 人 数 、 出院 人 数 、 科 室 病 床 使 用 率 、 病 床 周转 次 数 、 平 均 每 床 日 收费 额 、 
平均 每 床 日 收费 药品 费 、 平 均 病 床 工 作 日 的 详细 信息 。 数 据 是 被 前 面 的 各 
个 维度 联合 过 滤 后 的 一 个 子 集 。 


7.2.5 手术 数据 分 析 


手术 数据 分 析 从 时 间 、 医 师 、 手 术 类 型 3 个 维度 分 析 手 术 例 数 、 手 术 
费用 、 手 术 成 功 例 数 、 手 术 治 愈 例 数 、 手 术 成 功率 、 手 术 治愈 率 、 手 术 占 
用 床位 日 等 指标 的 走势 及 对 比 情 况 。 

手术 数据 分 析 从 时 间 、 医 师 、 手 术 类 型 、 明 细 4 个 标签 页 面 以 及 典型 
指标 的 二 级 页 面 分 析 各 个 指标 。 对 于 多 层次 的 维度 标签 页 ， 可 以 通过 钻 取 
功能 查看 下 一 层 维度 页 面 的 指标 。 

手术 数据 分 析 的 维度 包括 时 间 、 医 师 、 手 术 类 型 三 个 维度 。 其 中 时 间 
维度 层次 为 年 、 月 、 日 ， 医 师 维度 层次 为 科室 、 医 生 ， 手 术 类 型 维度 层次 
为 科室 、 手 术 等 级 、 手 术 名 称 。 

手术 数据 分 析 的 指标 分 为 基础 指标 和 计算 指标 ， 其 中 基础 指标 有 手术 
例 数 、 手 术 成 功 例 数 、 手 术 治 愈 倒数 、 手 术 医疗 收入 、 手 术 药品 收入 、 手 
术 占用 床位 日 ， 计算 指标 有 药 占 比 、 手 术 成 功率 、 手 术 治 愈 率 、 手 术 出 院 
病人 平均 住院 日 、 科 室 手 术 病床 使 用 率 、 手 术 病 床 周转 次 数 、 每 例 手 术 药 
品 费 。 其 中 药 占 比 为 手术 药品 收入 与 手术 医疗 收入 和 手术 药品 收入 的 比率 ， 
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手术 成 功率 为 手术 成 功 例 数 与 总 手术 例 数 的 比率 ， 手 术 治 愈 率 为 手术 治愈 
例 数 与 手术 总 例 数 的 比率 ， 手 术 出 院 病 人 平均 住院 日 为 手术 出 院 者 占用 总 
床 日 数 除 以 出 院 人 数 ， 科 室 手术 病床 使 用 率 为 手术 实际 占用 总 床 日 数 除 以 
手术 实际 开放 总 床 日 数 ， 手 术 病 床 周转 次 数 为 手术 人 数 除 以 平均 开放 病床 
数 ， 每 例 手 术 药品 费 为 手术 药品 费用 除 以 手术 例 数 。 

时 间 维 度 标签 页 可 以 查询 任意 医师 、 任 意 手术 类 型 的 各 个 年 份 、 各 个 
月 份 以 及 每 天 的 指标 的 走势 情况 。 通 过 折线 图 展示 各 个 指标 的 走势 情况 ， 
如 图 7-12 所 示 ， 体 现 了 每 天 手术 成 功率 和 手术 治愈 率 的 走势 情况 。 


100% 从 





























0% 
"12345678 9 101 121314151617 1819 2021 22 232425262728 29 3031 


加 成 功率 目 治 愈 率 


图 7-12 指标 在 时 间 维 度 的 比较 














医师 维度 标签 页 可 以 查询 任意 时 间 、 任 意 手 术 类 型 的 各 个 科室 、 各 个 
医生 的 有 关 手 术 例 数 、 手 术 医 药 收入 、 药 占 比 、 手 术 成 功率 、 手 术 治 愈 率 、 
手术 占用 床位 日 、 手 术 出 院 病 人 平均 住院 日 、 科 室 手 术 病床 使 用 率 、 手 术 
病床 周转 次 数 、 每 例 手 术 收 药品 费 等 指标 的 对 比 情 况 。 如 图 7-13 所 示 ， 通 
过 直方 图 展示 手术 成 功率 和 手术 治愈 率 的 对 比 情 况 。 














山 成 功率 ”出 治愈 率 


图 7-13 ”指标 在 科室 维度 的 比较 








手术 类 型 维度 标签 页 可 以 查询 任意 时 间 、 任 意 科 室 、 任 意 医 生 的 各 个 
手术 类 型 的 有 关 手 术 例 数 、 手 术 医 药 收入 、 药 占 比 、 手 术 成 功率 、 手 术 治 
愈 率 、 手 术 占用 床位 日 、 手 术 出 院 病 人 平均 住院 日 、 科 室 手 术 病 床 使 用 率 、 
手术 病床 周转 次 数 、 每 例 手 术 收 药品 费 等 指标 的 对 比 情况 。 

明细 页 面 用 类 似 报 表 的 表格 形式 展示 了 有 关 手 术 数据 分 析 的 明细 数 
据 , 包括 日 期 、 科室 、 医 生 、 手术 类 型 、 手 术 等 级 手术 名 称 、 手 术 医 疗 收入 、 
手术 药品 收入 的 详细 信息 。 

对 于 每 个 典型 指标 ， 都 有 一 个 对 应 的 二 级 页 面 ， 可 以 查看 该 指标 更 加 
详细 的 分 析 数 据 。 可 以 查看 指标 的 本 期 值 、 同 期 值 、 上 期 值 、 同 比 增长 率 、 
环比 增长 率 以 及 指标 的 排名 情况 。 如 图 7-14 所 示 ， 可 以 查看 手术 治愈 率 最 
高 的 10 种 手术 以 及 这 10 种 手术 医疗 收入 、 手 术 药 品 收入 情况 。 

















手术 名 称 手术 治愈 率 手术 医疗 收入 手术 药品 收入 
1000 300 









































图 7-14 指标 的 排名 比较 


7.2.6 用 药 数据 分 析 


用 药 数据 分 析 主 要 从 时 间 、 医 师 、 药 品 3 个 维度 分 析 用 药 数量 、 用 药 
金额 、 平 均 用 药 金额 等 指标 的 走势 及 对 比 情况 。 其 中 ， 时 间 维 度 的 层次 为 
年 > 月 > 日， 医师 维度 的 层次 为 科室 > 医生 ， 药 品 维度 的 层次 为 药品 种 类 > 
药品 分 类 > 药品 名 称 。 用 药 数据 分 析 从 时 间 、 医 师 、 药 品 、 明 细 4 个 标签 
页 面 以 及 典型 指标 的 二 级 页 面 分 析 各 个 指标 。 对 于 多 层次 的 维度 标签 页 ， 
可 以 通过 钻 取 功 能 查看 下 一 层 维度 页 面 的 指标 。 
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7.2.7 医疗 项 目 收入 数据 分 析 


医疗 项 目 收入 数据 分 析 从 时 间 、 医 师 、 医 疗 收入 类 型 3 个 维度 分 析 数 量 、 
金额 、 平 均 金额 的 走势 及 对 比 情 况 。 其 中 ， 时 间 维 度 的 层次 为 年 > 月 > 日 ， 
医师 维度 的 层次 为 科室 之 医生 ， 医 疗 收入 类 型 的 维度 值 有 床位 收入 、 挂 号 
收入 、 护 理 收入 、 化 验收 入 、 检 查收 入 、 手 术 收 入 、 诊 察 收 入 、 治 疗 收入 、 
其 他 收入 。 医 疗 项 目 收 入 数据 分 析 从 时 间 、 医 师 、 医 疗 收入 类 型 、 明 细 4 
个 标签 页 以 及 典型 指标 的 二 级 页 面 分 析 各 个 指标 。 对 于 多 层次 的 维度 标签 
页 ， 可 以 通过 钻 取 功能 查看 下 一 层 维 度 页 面 的 指标 。 


7.2.8 大 型 诊断 检查 数据 分 析 


大 型 诊断 检查 数据 分 析 从 时 间 ( 预 约 时 间 、 就 诊 时 间 ) 、 医 师 、 检 查 
类 型 3 个 维度 分 析 检 查 次 数 、 收 费 金 额 \ 平 均 收费 等 指标 的 走势 及 对 比 情况 。 
其 中 时 间 可 以 为 预约 时 间或 者 就 诊 时 间 ， 时 间 维 度 层次 为 年 > 月 > 日 ， 医 
师 维度 的 层次 为 科室 > 医生 , 检查 类 型 的 维度 值 为 CT、MRI、 彩 B、PET 等 。 
大 型 诊断 检查 数据 分 析 从 时 间 、 医 师 、 检 查 类 型 、 明 细 4 个 标签 页 面 以 及 
典型 指标 的 二 级 页 面 分 析 各 个 指标 。 对 于 多 层次 的 维度 标签 页 ， 可 以 通过 
钻 取 功能 查看 下 一 层 维度 页 面 的 指标 。 


7.2.9 体检 数据 分 析 


体检 数据 分 析 从 时 间 、 体 检 项 目 2 个 维度 分 析 体 检 人 数 、 异 常人 数 、 
异常 占 比 的 走势 及 对 比 情况 。 其 中 时 间 维 度 的 层次 为 年 、 月 、 日 ， 体 检 项 
目 维度 值 有 血 常规 、 内 科 检 查 、 血 脂 、 尿 常规 、 妇 科 检 查 、 一 般 检查 、B 超 、 
防 癌 检 查 、 外 科 检 查 、 胸 透 、 肾 功能 、 肝 功能 。 基 础 指标 有 体检 人 数 、 异 
常人 数 ， 计 算 指标 异常 占 比 为 异常 人 数 与 体检 人 数 之 比 。 体 检 数 据 分 析 从 
时 间 、 体 检 项 目 、 明 细 3 个 标签 页 面 以 及 典型 指标 的 二 级 页 面 分 析 各 个 指标 。 
对 于 多 层次 的 维度 标签 页 ， 可 以 通过 钻 取 功 能 查看 下 一 层 维度 页 面 的 指标 。 


如 体检 项 目 维度 标签 页 ， 通 过 直方 双 Y 图 体现 体检 人 数 、 异 常人 数 、 异 常 
占 比 的 对 比 情况 如 图 7-15 所 示 。 
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图 7-15 体检 项 目的 一 般 比较 


体检 项 目 维度 标签 页 ， 通 过 饼 图 展示 各 个 体检 项 目 体检 人 数 的 占 比 情 
况 ， 如 图 7-16 所 示 。 


















































内 科 检 查 ，9.96%  。 血 常规 ，15.33% 
血脂 ，3.83% 肝 功 能 ，1.92% 
尿 常规 ，9.58% AM 肾 功 能 ，3.83% 
妇科 检查 ，1.92% 胸 透 ，8.62% 


一 般 检 查 ，13.41% 外 科 检 查 ，7.66% 





B 超 ，11.49% 防 癌 检 查 ，12.45% 
图 7-16 体检 项 目的 份额 比较 


7.2.10 物资 出 入 库 数据 分 析 


物资 出 入 库 数据 分 析 从 时 间 、 科 室 、 物 资 类 别 3 个 维度 分 析 入 库 数量 、 
出 库 数量 、 现 存量 、 入 库 金额 、 出 库 金 额 的 走势 及 对 比 情 况 ， 其 中 物资 类 
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别 的 维度 值 有 办 公用 品 、 妇 科 用 药 、 固 定 资产 、 泌 尿 系统 用 药 、 生 活用 品 、 
食品 饮料 、 试 剂 用 品 、 特 殊 医用 材料 、 一 次 性 卫生 材料 、 医 用 低 值 易 耗 品 。 
物资 出 入 库 数据 分 析 从 时 间 、 科 室 、 物 资 类 别 、 明 细 4 个 标签 页 以 及 典型 
指标 的 二 级 页 面 分 析 各 个 指标 。 如 在 时 间 维 度 标签 页 ， 通 过 折线 图 将 入 库 
数量 和 出 库 数量 放 在 同一 张 图 上 ， 体 现 了 入 库 数 量 和 出 库 数量 的 走势 及 对 


比 情况 ， 如 图 7-17 所 示 。 
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图 7-17 入 出 库 的 时 间 比 较 


在 物资 类 别 维度 标签 页 ， 如 图 7-18 所 示 ， 通 过 饼 图 展示 各 个 物资 类 别 


的 现存 量 的 占 比 情况 。 


妇科 用 药 ，10.26% 办 公用 品 ，11.28% 
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图 7-18 库存 物资 的 占 比分 析 


该 方案 从 6 个 方面 分 析 关 于 财政 的 相关 数据 ， 分 别 为 监控 中 心 、 
数据 分 析 、 支 出 数据 分 析 、 收 支 执行 数据 分 析 、 预 算 执行 用 款 分 析 、 


采购 数据 分 析 。 


收入 
政府 


7.3 ”政府 财政 数据 分 析 


经 过 多 年 信息 化 建设 和 推广 ， 各 地 财政 部 门 已 经 积累 了 大 量 丰 富 的 财 
政 业务 数据 资源 ， 应 该 将 这 些 资源 进行 整合 ， 形 成 可 用 作 分 析 决 策 的 自助 
分 析 系 统 。 


7.3.1 监控 中 心 


监控 中 心 提供 对 最 新 数据 和 主要 数据 的 监控 和 分 析 ， 用 于 市 政府 和 财 
政 部 门 领导 日 常 监控 财政 收 支 情况 ， 并 作为 深入 精细 数据 分 析 的 门户 。 

监控 中 心 的 数据 只 与 时 间 维 度 有 关 ， 与 其 他 维度 无 关 ， 可 以 查看 任意 
日 期 的 一 些 综合 指标 。 

监控 中 心 的 指标 有 基础 指标 和 计算 指标 ， 基 础 指标 有 预算 收入 、 收 入 
总 金额 、 总 支出 预算 、 支 出 总 金额 、 采 购 预算 、 采 购 金额 。 计 算 指标 有 单 
位 收入 总 金额 TOP10 排名 及 份额 、 单 位 支出 总 金额 TOP10 排名 及 份额 ， 
其 中 单位 收入 总 金额 TOP10 排名 为 总 收入 金额 最 高 的 前 10 个 单位 ， 单 位 
收入 总 金额 TOP10 份额 为 总 收入 金额 最 高 的 前 10 个 单位 的 收入 金额 占 所 
有 单位 总 收入 的 占 比 ， 单 位 支出 总 金额 TOP10 排名 为 支出 总 金额 最 高 的 前 
10 个 单位 ， 单 位 支出 总 金额 TOP10 份额 为 支出 总 金额 最 高 的 前 10 个 单位 
的 支出 金额 占 所 有 单位 总 支出 的 占 比 。 

监控 中 心 从 概要 和 时 间 两 个 维度 标签 页 分 析 各 个 指标 。 

概要 标签 页 主要 分 析 的 是 各 个 指标 的 合计 数据 以 及 相关 指标 的 排名 情 
况 ， 用 于 平时 监控 有 关 财 政 收 入 、 财 政 支 出 的 相关 数据 。 概 要 页 面 分 析 的 
相关 指标 有 预算 收入 、 收 入 总 金额 、 总 支出 预算 、 支 出 总 金额 、 采 购 预算 、 
采购 金额 。 通 过 仪表 盘 表 示 各 个 指标 的 合计 数据 ， 如 通过 仪表 盘 表 示 预 算 
收入 ， 仪 表盘 的 指针 位 置 为 预算 收入 ， 仪 表盘 的 颜色 交界 处 为 上 年 的 决算 
值 ， 将 两 个 指标 放 在 一 张 图 形 上 ， 使 对 比 更 加 明显 。 通 过 横 条 图 分 析 相 关 
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指标 的 排名 情况 ， 通 过 饼 图 展示 相关 指标 排名 的 份额 情况 。 

时 间 维 度 标签 页 可 以 查看 各 个 年 份 及 各 个 月 份 指标 的 走势 情况 。 通 过 
折线 图 分 析 预 算 收 入 、 收 入 总 金额 、 总 支出 预算 、 支 出 总 金额 、 采 购 预算 、 
采购 金额 的 走势 情况 。 可 以 将 收入 总 金额 和 支出 总 金额 放 在 一 张 图 形 上 ， 
既 可 以 查看 这 两 个 指标 的 走势 ， 也 可 以 分 析 二 者 的 对 比 关系 。 


7.3.2 收入 数据 分 析 


收入 数据 分 析 从 时 间 、 单 位 、 科 目 三 个 维度 分 析 预 算 收入 、 收 入 总 额 
等 指标 的 走势 及 对 比 情 况 。 

收入 数据 分 析 从 时 间 、 单 位 、 科 目 三 个 维度 分 析 各 个 指标 。 时 间 维 度 
的 层次 为 年 、 月 ， 单 位 维度 层次 结构 为 城市 、 局 、 下 属 单位 ， 局 如 公安 局 、 
教育 局 、 环 保 局 、 城 乡 建设 局 、 房 管 局 、 交 通 运输 局 、 农 委 、 水 利 局 等 ， 
科目 为 各 个 收入 科目 ， 如 营业 税 、 企 业 所 得 税 、 个 人 所 得 税 、 城 市 建设 税 、 
房产 税 、 印 花 税 、 土 地 增值 税 、 教 育 附 加 专项 收入 、 地 方 财政 税 费 附加 收 
入 等 科目 。 

收入 数据 分 析 的 指标 有 基础 指标 和 计算 指标 ， 基 础 指标 有 年 初 预算 收 
入 、 调 整 后 预算 、 收 入 总 额 ， 计 算 指标 有 累计 收入 总 额 、 收 入 占 预 算 收 入 
比 、 同 比 增长 率 、 环 比 增长 率 、 单 位 收入 TOP10 排名 及 份额 、 单 位 收入 
BOTTOM10 排名 等 。 其 中 累计 收入 总 额 为 年 初 至 所 选 日 期 的 累计 收入 总 
额 ， 收 入 占 预算 收入 比 为 收入 总 额 与 调整 后 预算 的 比 ， 同 比 增长 率 为 本 期 
指标 值 与 上 一 年 同期 的 数据 相 比 较 的 增长 率 ， 环 比 增长 率 为 本 期 指标 值 对 
于 本 年 上 一 期 的 数据 相 比 较 的 增长 率 ， 单 位 收入 TOP10 排名 为 收入 最 高 的 
前 10 个 单位 ， 单 位 收入 TOP10 份额 为 收入 最 高 的 前 10 个 单位 的 收入 占 所 
有 单位 总 收入 的 占 比 ， 单 位 收入 BOTTOM10 排名 为 单位 收入 最 低 的 10 个 
单位 。 

收入 数据 分 析 有 时 间 、 单 位 、 科 目 、 明 细 4 个 标签 页 ， 以 及 每 个 基本 
指标 的 二 级 页 面 。 对 于 多 层次 的 维度 标签 页 ， 可 以 通过 向 下 钻 取 功 能 查看 
层次 结构 下 一 级 的 数据 。 


时 间 《〈 年 、 月 ) 维度 标签 页 可 以 查看 任意 单位 、 任 意 科 目的 各 个 年 份 、 
各 个 月 份 以 及 每 天 的 指标 走势 。 通 过 折线 图 分 析 年 初 预算 收入 、 调 整 后 预 
算 比较 、 收 入 总 额 、 收 入 占 预 算 收入 等 指标 的 走势 情况 。 

单位 维度 标签 页 可 以 查看 任意 时 间 、 任 意 科 目的 各 个 单位 指标 的 对 比 
情况 。 通 过 直方 图 分 析 年 初 预算 收入 、 调 整 后 预算 比较 、 收 入 总 额 、 收 入 
占 预算 收入 等 指标 的 对 比 情况 。 

科目 维度 标签 页 可 以 查看 任意 时 间 、 任 意 单位 的 各 个 科目 指标 的 对 比 
情况 。 通 过 直方 图 分 析 年 初 预算 收入 、 调 整 后 预算 比较 、 收 入 总 额 、 收 入 
占 预算 收入 等 指标 的 对 比 情况 。 

对 于 每 个 基本 指标 ， 都 有 一 个 对 应 的 二 级 页 面 ， 可 以 查看 该 指标 的 更 
加 详细 的 分 析 数 据 。 主 要 分 析 的 是 指标 的 本 期 值 、 同 期 值 、 上 期 值 、 同 比 
增长 率 、 环 比 增长 率 以 及 相关 指标 的 排名 情况 。 

明细 页 面 以 表格 形式 展示 了 相关 收入 数据 的 每 笔 明 细 ， 包 括 时 间 、 单 
位 名 称 、 科 目 、 年 初 预 算 收入 、 调 整 后 预算 收入 、 收 入 总 金额 。 


7.3.3 支出 数据 分 析 


支出 数据 分 析 从 时 间 、 单 位 一 项 目 、 经 济 科目 、 来 源 科目 4 个 维度 分 
析 年 初 预算 支出 、 调 整 后 预算 支出 、 总 支出 预算 、 支 出 总 额 、 预 算 执行 进 
度 等 指标 的 走势 及 对 比 情况 。 

支出 数据 分 析 有 了 时间、 单位 一 项 目 、 经 济 科 目 、 来 源 科目 4 个 维度 ， 
时 间 维 度 的 层次 为 年 、 月 ， 单 位 一 项 目的 维度 层次 为 单位 、 项 目 ， 经 济 科 
目的 维度 层次 为 经 济 科 目 、 二 级 科目 。 

收入 数据 分 析 的 指标 有 基础 指标 和 计算 指标 ， 基 础 指标 有 年 初 预算 支 
出 、 调 整 后 预算 支出 、 总 支出 预算 、 支 出 总 金额 、 项 目 个 数 ， 计 算 指标 有 
预算 执行 进度 ， 其 中 预算 执行 进度 计算 为 支出 总 金额 与 总 支出 预算 的 比 。 

支出 数据 分 析 有 时 间 、 单 位 一 项 目 、 经 济 科目 、 来 源 科 目 、 明 细 5 个 
标签 页 及 基本 指标 的 二 级 页 面 。 对 于 多 层次 的 维度 ， 可 以 通过 钻 取 功能 查 
看 下 一 级 的 数据 。 可 以 通过 钻 取经 济 科目 查看 该 经 济 科目 的 来 源 科目 ， 看 
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到 某 个 经 济 科目 的 来 源 ， 也 可 以 通过 钻 取 来 源 科目 查看 各 个 经 济 科目 ， 查 
看 某 个 来 源 科目 用 在 哪些 经 济 科目 上 。 

时 间 维 度 标签 页 ， 通 过 折线 图 展示 各 个 指标 的 走势 情况 ， 将 总 支出 预 
算 和 支出 总 金额 放 在 一 张 图 形 上 ， 展 示 了 这 两 个 指标 的 走势 情况 也 体现 了 
二 者 的 对 比 关 系 。 

单位 一 项 目 ( 单 位、 项 目 〉 维 度 标签 页 ， 通 过 直方 图 以 及 直方 双 Y 图 
展示 各 个 单位 的 相关 指标 的 对 比 情况 。 通 过 直方 双 Y 图 ， 将 总 支出 预算 、 
支出 总 金额 、 预 算 执行 进度 放 在 同一 张 图 形 上 ， 更 加 清晰 地 分 析 各 个 单位 
支出 预算 的 执行 情况 。 还 可 以 通过 钻 取 功 能 查询 任意 单位 的 各 个 项 目的 支 
出 情况 。 

经 济 科 目 〈 科 目 、 二 级 科目 ) 维度 标签 页 ， 通 过 直方 图 展示 各 个 经 济 
科目 的 关于 总 支出 预算 、 支 出 总 金额 、 预 算 执行 进度 的 对 比 情况 。 通 过 钻 
取 功 能 ， 查 询 经 济 科目 下 的 各 个 二 级 科目 的 预算 支出 情况 ， 同 时 还 可 以 查 
询 各 个 经 济 科目 的 来 源 科目 。 

来 源 科目 维度 标签 页 ， 通 过 直方 图 双 Y 图 展示 各 个 来 源 科目 的 关于 总 
支出 预算 、 支 出 总 金额 、 预 算 执行 进度 的 对 比 情况 。 还 可 以 通过 钻 取 功 能 ， 
查询 各 来 源 科目 用 在 了 哪些 经 济 科目 上 。 

明细 标签 页 用 表格 展示 了 支出 数据 的 每 笔 明细 ， 包 括 时 间 、 单 位 名 称 、 
项 目 名 称 、 经 济 科 目 、 来 源 科目 、 年 初 预算 、 调 整 后 预算 、 总 支出 预算 、 
支出 总 金额 。 


7.3.4 收 支 执行 数据 分 析 


收 支 执行 数据 分 析 从 时 间 、 单 位 两 个 维度 分 析 期 初 结余 、 收 入 总 金额 、 
支出 总 金额 、 期 末 结 余 指 标的 走势 及 对 比 情况 。 时 间 维 度 的 层次 为 年 、 月 。 
收 支 执行 数据 分 析 从 时 间 、 单 位 、 明 细 3 个 标签 页 及 基本 指标 的 二 级 页 面 
分 析 各 个 指标 ， 其 中 明细 页 面 用 表格 展示 了 收 支 数据 的 每 笔 明细 ， 包 括 时 
间 、 单 位 名 称 、 期 初 结余 、 收 入 总 金额 、 支 出 总 金额 、 期 末 结 余 。 


7.3.5 预算 执行 用 款 数据 分 析 


预算 执行 用 款 数 据 分 析 从 时 间 、 单 位 一 项 目 两 个 维度 分 析 用 款 支付 节 
点 发 生 的 天 数 和 次 数 。 时 间 维 度 的 层次 为 年 、 月 ， 单 位 一 项 目的 维度 层次 
为 单位 、 项 目 ， 指 标 有 已 批复 的 次 数 和 天 数 、 已 生成 支付 令 的 次 数 和 天 数 、 
汇总 结算 单 形成 的 次 数 和 天 数 、 数 据 已 转发 银行 的 次 数 和 天 数 、 银 行 已 回 
单 的 次 数 和 天 数 、 国 库 处 已 回 单 确认 的 次 数 和 天 数 。 预 算 执行 用 款 数 据 分 
析 从 时 间 、 单 位 一 项 目 、 明 细 3 个 标签 页 面 分 析 各 个 指标 ， 其 中 时 间 页 面 
使 用 折线 图 分 析 任 意 单位 、 任 意 项 目 各 个 年 份 或 者 各 个 月 份 的 用 款 支付 节 
点 的 次 数 和 天 数 的 走势 情况 ， 单 位 一 项 目 页 面 使 用 直方 图 分 析 任 意 时 间 各 
个 单位 、 各 个 项 目的 用 款 支 付 节点 的 次 数 和 天 数 的 对 比 情况 ， 明 细 页 面 展 
示 的 是 预算 执行 用 款 数据 的 明细 ， 包 括 时 间 、 单 位 名 称 、 项 目 名 称 、 已 批 
复 天 数 、 已 生成 支付 令 天 数 、 汇 总 结算 单 形成 天 数 、 数 据 已 转发 银行 天 数 、 
银行 已 回 单 天 数 、 国 库 处 已 回 单 确认 天 数 。 


7.3.6 政府 采购 数据 分 析 


政府 采购 数据 分 析 从 时 间 、 单 位 、 采 购 目 录 、 供 应 商 4 个 维度 分 析 有 
关 采 购 次 数 、 采 购 预算 总 额 、 采 购 金额 相关 指标 的 走势 及 对 比 情况 。 

政府 采购 数据 分 析 的 维度 有 时 间 、 单 位 、 采 购 目 录 、 供 应 商 4 个 维度 ， 
时 间 维 度 层次 为 年 、 月 ， 单 位 维度 层次 为 单位 、 下 属 单位 ， 采 购 维 度 层次 
为 采购 类 别 、 货 品 分 类 、…… 、 货 品名 称 。 对 于 多 层次 的 维度 可 以 通过 钻 
取 功 能 查看 下 一 层次 维度 的 指标 。 

政府 采购 数据 分 析 的 指标 有 基础 指标 和 计算 指标 ， 基 础 指标 为 采购 次 
数 、 采 购 预算 总 额 〈 该 指标 与 供应 商 无 关 ) 、 采 购 金额 ， 计 算 指标 为 采购 
次 数 占 比 、 采 购 金 额 占 比 ， 累 计 采 购 预算 总 额 、 累 计 采 购 金额 、 采 购 次 数 
占 比 为 某 个 单位 的 采购 次 数 与 所 有 单位 采购 总 次 数 的 比值 ， 采 购 金 额 占 比 
为 某 个 单位 的 采购 金额 与 所 有 单位 采购 总 金额 的 比值 ， 累 计 采 购 预算 总 额 
为 年 初 至 今 到 所 选 日 期 的 采购 预算 总 额 的 合计 值 ， 累 计 采 购 金 额 为 年 初 至 
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今 到 所 选 日 期 的 采购 金额 的 合计 值 。 

政府 采购 数据 分 析 从 时 间 、 单 位 、 采 购 目录 、 供 应 商 、 明 细 5 个 标签 
页 及 每 个 基本 指标 的 二 级 页 面 分 析 各 个 指标 。 

时 间 《〈 年 、 月 ) 维度 标签 页 可 以 查询 任意 单位 、 任 意 采 购 目 录 、 任 意 
供应 商 的 各 个 年 份 各 个 月 份 关于 采购 次 数 、 采 购 预算 总 额 、 采 购 金 额 等 指 
标的 走势 情况 。 通 过 折线 图 将 采购 预算 总 额 和 采购 金额 放 在 一 张 图 形 上 既 
展示 了 这 两 个 指标 的 走势 情况 ， 也 体现 二 者 的 对 比 关 系 。 

单位 (单位 、 下 属 单位 ) 维度 标签 页 可 以 查询 任意 时 间 、 任 意 采购 目录 、 
任意 供应 商 的 各 个 单位 的 关于 采购 次 数 、 采 购 预算 总 额 、 采 购 金 额 的 对 比 
情况 。 通 过 直方 图 分 析 各 个 单位 关于 采购 次 数 、 采 购 预 算 金额 、 采 购 金额 
的 对 比 关系 ， 通 过 饼 图 体现 各 个 单位 关于 采购 次 数 、 采 购 金额 的 占 比 情况 。 

采购 目录 (采购 类 别 、 货 品 分 类 、…… 、 货 品名 称 ) 维度 标签 页 可 以 
查询 任意 时 间 、 任 意 单位 、 任 意 供应 商 的 各 个 采购 目录 的 关于 采购 次 数 、 
采购 预算 总 额 、 采 购 金额 的 对 比 情况 ， 通 过 直方 图 展示 指标 的 对 比 情况 。 

供应 商 维度 标签 页 可 以 查询 任意 时 间 、 任 意 单位 、 任 意 采购 目录 的 各 
个 供应 商 的 采购 次 数 、 采 购 金 额 的 对 比 情 况 ， 通 过 直方 图 展示 指标 的 对 比 
情况 。 

对 于 每 个 基本 指标 ， 都 有 一 个 对 应 的 二 级 页 面 ， 可 以 查看 该 指标 更 加 
详细 的 分 析 数 据 。 主 要 分 析 的 是 指标 的 本 期 值 、 同 期 值 、 上 期 值 、 同 比 增 
长 率 、 环 比 增长 率 以 及 相关 指标 的 排名 情况 。 如 各 个 单位 采购 金额 的 同比 
增长 率 、 环 比 增长 率 ， 采 购 金 额 最 高 的 10 个 单位 ， 采 购 金 额 最 高 的 10 种 
货品 。 

采购 数据 分 析 中 的 明细 页 面 有 两 个 ， 分 别 为 政府 采购 明细 和 采购 供应 
商 明细 ， 政 府 采 购 明细 用 表格 显示 时 间 、 单 位 名 称 、 采 购 商 品 、 政 府 采购 
预算 金额 、 采 购 金 额 的 每 笔 数 据 ; 采购 供应 商 明 细 用 表格 显示 时 间 、 单 位 
名 称 、 采 购 商 品 、 采 购 金 额 的 每 笔 数 据 。 数 据 是 被 前 面 的 各 个 维度 联合 过 
滤 后 的 一 个 子 集 。 


本 书 在 写作 中 ， 得 到 不 少 人 的 帮助 ， 在 此 一 并 致谢 。 

上 海信 息 化 发 展 研究 协会 徐 龙 章 秘 书 长 认真 浏览 了 书稿 ， 提 出 几 个 很 
好 的 修改 意见 ， 并 提供 一 些 参考 资料 。 上 海 市 软件 行业 协会 杨 根 兴 常 务 副 
会 长 浏览 书稿 并 提出 宝贵 意见 。 南 京 航空 航天 大 学 丁 秋 林 教 授 非常 关心 本 
书 的 出 版 。 

王 美玲 参与 文字 整理 ， 林 彬 彬 整理 了 供应 链 的 功能 ， 郭 晓 杰 整理 了 财 
务 比率 和 案例 。 
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